Prompts to Proxies: Emulating Human Preferences via a Compact LLM Ensemble

2509.11311v1 cs.AI, cs.CY 2025-09-17
Авторы:

Bingchen Wang, Zi-Yu Khoo, Bryan Kian Hsiang Low

Резюме на русском

## Контекст Large language models (LLMs) стали важной частью современной информатики, показав способность эмулировать человеческие ответы в различных задачах. Однако применение LLMs в области социальных наук остается нерешенной проблемой. Одной из основных проблем является высокая стоимость коллекции данных для социальных исследований, а другой — демографическая необратимость результатов, которая мешает точному анализу. Эти проблемы требуют новых подходов для эффективного совершенствования систем понимания человеческих предпочтений. ## Метод Методом решения становится создание управляемой системы, которая моделирует поведение человека с помощью LLM. Эта система состоит из двух фаз. В первой фазе создается персонаж, имитирующий поведение отдельного пользователя, с помощью специальной обработки текста. Во второй фазе выбирается действительно представительное подмножество этих персонажей, чтобы получить достоверный представитель человеческих предпочтений. Использована техника «репликация открытой предпочтения» (revealed preference), чтобы привести LLM к представлению реальных ответов, используя методы структурированного текста, семантического анализа и оптимизации. ## Результаты Для оценки метода применены реальные данные опросов. Наблюдаемая эффективность показана в способности LLM-системы воспроизводить агрегированные ответы с высоким достоверностьным уровнем. Эта система также демонстрирует возможность получения широкого разнообразия ответов, даже без использования демографических данных. Это не только улучшает методы социальных исследований, но и показывает возможность эффективного использования LLMs для решения проблем в этой области. ## Значимость Предлагаемый подход может быть применен в различных сферах социальных наук, включая обзоры, маркетинг и другие области, где требуется понимание человеческих предпочтений. Он позволяет экономить ресурсы и повышает объем и глубину данных, обеспечивая новый подход к исследованию предпочтений. Это также открывает возможности для развития новых методов понимания людьми в социальных системах. ## Выводы Предложенная модель P2P доказала свою эффективность в моделировании человеческих предпочтений с помощью LLM. Она предлагает новый подход к решению проблем демографического разнообразия и стоимости выполнения опросов. Будущие исследования будут фокусироваться на расширении методов во взаимодействии с другими системами и улучшении точности модели.

Abstract

Large language models (LLMs) have demonstrated promise in emulating human-like responses across a wide range of tasks. In this paper, we propose a novel alignment framework that treats LLMs as agent proxies for human survey respondents, affording a cost-effective and steerable solution to two pressing challenges in the social sciences: the rising cost of survey deployment and the growing demographic imbalance in survey response data. Drawing inspiration from the theory of revealed preference, we formulate alignment as a two-stage problem: constructing diverse agent personas called endowments that simulate plausible respondent profiles, and selecting a representative subset to approximate a ground-truth population based on observed data. To implement the paradigm, we introduce P2P, a system that steers LLM agents toward representative behavioral patterns using structured prompt engineering, entropy-based sampling, and regression-based selection. Unlike personalization-heavy approaches, our alignment approach is demographic-agnostic and relies only on aggregate survey results, offering better generalizability and parsimony. Beyond improving data efficiency in social science research, our framework offers a testbed for studying the operationalization of pluralistic alignment. We demonstrate the efficacy of our approach on real-world opinion survey datasets, showing that our aligned agent populations can reproduce aggregate response patterns with high fidelity and exhibit substantial response diversity, even without demographic conditioning.

Ссылки и действия