Что такое генеративный ИИ?

Генеративный ИИ простыми словами: как модели, изучающие закономерности в данных, создают оригинальные тексты, изображения, аудио и код по запросу.

Генеративный ИИ — это класс моделей искусственного интеллекта, которые создают новый контент — например, текст, изображения, аудио, видео или код, — а не просто классифицируют или делают прогнозы на основе существующих данных. Такая модель изучает закономерности и структуру обучающих материалов и использует полученные знания, чтобы формировать оригинальные результаты в ответ на запрос. Термин охватывает широкое семейство методов — от больших языковых моделей на основе трансформеров, лежащих в основе чат-ботов, до диффузионных моделей, обеспечивающих работу систем преобразования текста в изображение.

Как работает генеративный ИИ

Если говорить в общих чертах, генеративная модель обучается на большом корпусе примеров — книгах и коде для текста, изображениях с подписями для зрения, аудиотранскриптах и звуковых волнах для речи — и выявляет статистические закономерности, связывающие входные данные с выходными. В процессе обучения модель многократно корректирует свои внутренние параметры так, чтобы её предсказания совпадали с реальностью; этот процесс может требовать миллиардов примеров и огромных вычислительных ресурсов. После обучения модель получает запрос (промпт) и создаёт новый артефакт по частям: большая языковая модель предсказывает следующий токен (грубо говоря, слово или его фрагмент) с учётом всего предшествующего текста, а диффузионная модель итеративно преобразует случайный шум в связное изображение, ориентируясь на текстовое описание.

Например, по запросу «хайку об утренних пробках в Токио» текстовая модель выберет наиболее вероятное первое слово, затем, опираясь на уже сгенерированные слова, выберет следующее и так далее, пока стихотворение не будет выглядеть завершённым. Результат не извлекается из базы данных — он вычисляется «на лету» на основе изученных закономерностей, поэтому два запуска с одинаковым запросом могут давать разные, но одинаково правдоподобные результаты.

Почему это важно

Генеративный ИИ меняет способы создания контента, общения и работы для людей и организаций. Он пишет черновики писем, резюмирует документы, создаёт и объясняет код, разрабатывает дизайн продуктов, сочиняет музыку и ускоряет научные исследования, предлагая молекулы и структуры белков. Поскольку одна и та же модель справляется со множеством задач, выраженных на естественном языке, она снижает стоимость подготовки черновиков и делает сложную интеллектуальную поддержку доступной для неспециалистов. В то же время она поднимает непростые вопросы об авторстве, авторском праве, галлюцинациях, предвзятости и энергозатратах крупных обучающих запусков, которые сегодня находятся в центре внимания разработчиков, регуляторов и конечных пользователей.

Основные типы генеративных моделей

  • Большие языковые модели (LLM) — модели на основе трансформеров, такие как семейства GPT, Claude и Llama, которые генерируют текст и всё чаще интерпретируют изображения и аудио.
  • Диффузионные модели — архитектура, лежащая в основе большинства современных систем преобразования текста в изображение и текста в видео, включая Stable Diffusion, DALL·E и Imagen.
  • Генеративно-состязательные сети (GAN) — более ранний, но по-прежнему влиятельный подход, в котором генератор и дискриминатор обучаются друг против друга; широко используются для синтеза изображений и переноса стиля.
  • Авторегрессионные модели и варианты трансформеров для аудио и кода — модели, которые генерируют речь, музыку или исходный код токен за токеном, например системы в стиле Codex и модели для генерации музыки.

Коротко говоря, генеративный ИИ — это скорее не отдельный продукт, а новый способ создания программного обеспечения: вместо того чтобы прописывать явные правила, разработчики формулируют запросы к обученной модели и направляют её результат. По мере того как базовые модели становятся всё более мощными и лучше согласованными с намерениями человека, их влияние продолжает расширяться практически во всех сферах творческой и интеллектуальной деятельности.

Вам также может понравиться

Похожие статьи