Prompts to Proxies: Emulating Human Preferences via a Compact LLM Ensemble
2509.11311v1
cs.AI, cs.CY
2025-09-17
Авторы:
Bingchen Wang, Zi-Yu Khoo, Bryan Kian Hsiang Low
Резюме на русском
## Контекст
Large language models (LLMs) стали важной частью современной информатики, показав способность эмулировать человеческие ответы в различных задачах. Однако применение LLMs в области социальных наук остается нерешенной проблемой. Одной из основных проблем является высокая стоимость коллекции данных для социальных исследований, а другой — демографическая необратимость результатов, которая мешает точному анализу. Эти проблемы требуют новых подходов для эффективного совершенствования систем понимания человеческих предпочтений.
## Метод
Методом решения становится создание управляемой системы, которая моделирует поведение человека с помощью LLM. Эта система состоит из двух фаз. В первой фазе создается персонаж, имитирующий поведение отдельного пользователя, с помощью специальной обработки текста. Во второй фазе выбирается действительно представительное подмножество этих персонажей, чтобы получить достоверный представитель человеческих предпочтений. Использована техника «репликация открытой предпочтения» (revealed preference), чтобы привести LLM к представлению реальных ответов, используя методы структурированного текста, семантического анализа и оптимизации.
## Результаты
Для оценки метода применены реальные данные опросов. Наблюдаемая эффективность показана в способности LLM-системы воспроизводить агрегированные ответы с высоким достоверностьным уровнем. Эта система также демонстрирует возможность получения широкого разнообразия ответов, даже без использования демографических данных. Это не только улучшает методы социальных исследований, но и показывает возможность эффективного использования LLMs для решения проблем в этой области.
## Значимость
Предлагаемый подход может быть применен в различных сферах социальных наук, включая обзоры, маркетинг и другие области, где требуется понимание человеческих предпочтений. Он позволяет экономить ресурсы и повышает объем и глубину данных, обеспечивая новый подход к исследованию предпочтений. Это также открывает возможности для развития новых методов понимания людьми в социальных системах.
## Выводы
Предложенная модель P2P доказала свою эффективность в моделировании человеческих предпочтений с помощью LLM. Она предлагает новый подход к решению проблем демографического разнообразия и стоимости выполнения опросов. Будущие исследования будут фокусироваться на расширении методов во взаимодействии с другими системами и улучшении точности модели.
Abstract
Large language models (LLMs) have demonstrated promise in emulating
human-like responses across a wide range of tasks. In this paper, we propose a
novel alignment framework that treats LLMs as agent proxies for human survey
respondents, affording a cost-effective and steerable solution to two pressing
challenges in the social sciences: the rising cost of survey deployment and the
growing demographic imbalance in survey response data. Drawing inspiration from
the theory of revealed preference, we formulate alignment as a two-stage
problem: constructing diverse agent personas called endowments that simulate
plausible respondent profiles, and selecting a representative subset to
approximate a ground-truth population based on observed data. To implement the
paradigm, we introduce P2P, a system that steers LLM agents toward
representative behavioral patterns using structured prompt engineering,
entropy-based sampling, and regression-based selection. Unlike
personalization-heavy approaches, our alignment approach is
demographic-agnostic and relies only on aggregate survey results, offering
better generalizability and parsimony. Beyond improving data efficiency in
social science research, our framework offers a testbed for studying the
operationalization of pluralistic alignment. We demonstrate the efficacy of our
approach on real-world opinion survey datasets, showing that our aligned agent
populations can reproduce aggregate response patterns with high fidelity and
exhibit substantial response diversity, even without demographic conditioning.
Ссылки и действия
Дополнительные ресурсы: