If generative AI is the answer, what is the question?

2509.06120v1 cs.LG, stat.ML 2025-09-12
Авторы:

Ambuj Tewari

Резюме на русском

## Контекст Генерирующая искусственная интеллектуальная система (Generative AI) — это область искусственного интеллекта, которая сосредоточена на создании новых данных, которые могут быть похожими на существующие. Она широко применяется в областях, таких как разработка текста, изображений, аудио, видео, кода и даже молекул. Однако, несмотря на свою мощь и широкое распространение, возникает вопрос: если Generative AI — это ответ, то что же представляет собой вопрос? Эта статья основывается на этом вопросе, пытаясь понять, что значит "генерировать" в контексте машинного обучения. Она рассматривает существующие проблемы в этой области, а также мотивации для продолжения исследований в этом направлении. ## Метод Методология исследования, описанная в статье, включает в себя структурированное рассмотрение генерирующих моделей, а также развитие проблемы генерирования как отдельного машинного обучения задания. Автор использует пять основных семейств моделей: авторегрессионные модели, вариационные автоэнкодеры, нормализующие потоки, враждебные адверсарные сети (Generative Adversarial Networks, GANs) и модели по Diffusion. Также в статье представлена фреймворк, который подчеркивает различия между статистической оценкой распределения (density estimation) и генерированием данных. Этот фреймворк помогает понять, как разные модели подходят к задаче генерирования. Кроме того, в статье рассматривается математическая модель, основанная на теории игр, в которой два игрока — один игрок создает данные, а другой игрок пытается отличить генерируемые данные от реальных. ## Результаты В ходе работы были проанализированы различные модели генерирующего AI, а также рассмотрены их применения в различных областях. Например, модели GANs были применены для создания реалистичных изображений, а вариационные автоэнкодеры — для обработки и анализа данных. Были проведены эксперименты, показавшие, как подходы, основанные на Generative AI, могут решать различные задачи, такие как создание текста, изображений и даже аудио. В результате, автор показал, что Generative AI может использоваться не только для генерирования данных, но и для решения задач, связанных с определением текста, обнаружением спама и другими задачами, где требуется генерировать данные, которые могут быть полезны в различных областях. ## Значимость Генерирующая AI имеет многочисленные полезные применения. Например, она может применяться в сферах, таких как генерирование новостных статей, создание изображений и звуков, а также в области текстового поиска и распознавания языка. Одним из основных преимуществ генерирующей AI является её возможность автоматически генерировать дан

Abstract

Beginning with text and images, generative AI has expanded to audio, video, computer code, and molecules. Yet, if generative AI is the answer, what is the question? We explore the foundations of generation as a distinct machine learning task with connections to prediction, compression, and decision-making. We survey five major generative model families: autoregressive models, variational autoencoders, normalizing flows, generative adversarial networks, and diffusion models. We then introduce a probabilistic framework that emphasizes the distinction between density estimation and generation. We review a game-theoretic framework with a two-player adversary-learner setup to study generation. We discuss post-training modifications that prepare generative models for deployment. We end by highlighting some important topics in socially responsible generation such as privacy, detection of AI-generated content, and copyright and IP. We adopt a task-first framing of generation, focusing on what generation is as a machine learning problem, rather than only on how models implement it.

Ссылки и действия