ProToM: Promoting Prosocial Behaviour via Theory of Mind-Informed Feedback
2509.05091v1
cs.AI, cs.MA
2025-09-09
Авторы:
Matteo Bortoletto, Yichao Zhou, Lance Ying, Tianmin Shu, Andreas Bulling
Резюме на русском
## Контекст
В современном мире, где социальные взаимодействия и командные задачи становятсья все более важными, сложность в определении критериев, при которых индивидуальные цели могут быть конфликтующими с общими, остается значительной проблемой. Это особенно актуально для развития ИИ-систем, цель которых — повысить просоциальное поведение, то есть поддержание действий, которые способствуют благосостоянию других, даже когда это не прямо направлено на достижение собственных целей. Для решения этой проблемы важно разработать систему, которая будет предоставлять контекстуально подходящую и временно оптимальную обратную связь для поддержки просоциальных действий.
## Метод
Предлагается использовать теорию разума (Theory of Mind, ToM) для точного понимания индивидуальных целей субъектов взаимодействия. Методология ProToM основывается на двух основных этапах: интерпретации целей других агентов с помощью Байесовского вывода и построении контекстуально оптимальной обратной связи, которая помогает субъекту достичь своих целей. Используя реакции агентов в многоагентных сетях, ProToM выбирает конкретные слова и моменты для предоставления обратной связи, чтобы задействовать её в максимально эффективном виде. Этот подход позволяет системе работать как эффективный "коучер", который способен направлять поведение в нужном направлении, не теряя времени на ненужные действия.
## Результаты
В ходе экспериментов проверена эффективность ProToM в сравнении с современными моделями ИИ, работающими на базе больших языковых моделей. Эксперименты проводились в двух средах: "Двери, Ключи и Сокровища" и "Оверкукок". Результаты показали, что современные модели ИИ часто не могут предоставлять контекстуально обоснованные и временно оптимальные обратные связи, что приводит к неэффективности в общении и задержке выполнения задачи. В отличие от них, ProToM демонстрирует более успешное и быстрее выполнение задач, поддерживая просоциальное поведение. Эффективность ProToM также была подтверждена в исследовании с участием человеческих пользователей, которые выбирали её в качестве наиболее полезной и понятной.
## Значимость
Результаты ProToM открывают новые возможности в применении ИИ в области социальных взаимодействий, а также в технических системах, требующих командного поведения с общими целями. Используя теорию разума, ProToM предлагает новый подход к обратной связи, оптимизированный для просоциальных действий. Это может быть применено в ИИ-системах для улучшения сотрудничества в командных задачах, управления ресурсами, а также в области обучения,
Abstract
While humans are inherently social creatures, the challenge of identifying
when and how to assist and collaborate with others - particularly when pursuing
independent goals - can hinder cooperation. To address this challenge, we aim
to develop an AI system that provides useful feedback to promote prosocial
behaviour - actions that benefit others, even when not directly aligned with
one's own goals. We introduce ProToM, a Theory of Mind-informed facilitator
that promotes prosocial actions in multi-agent systems by providing targeted,
context-sensitive feedback to individual agents. ProToM first infers agents'
goals using Bayesian inverse planning, then selects feedback to communicate by
maximising expected utility, conditioned on the inferred goal distribution. We
evaluate our approach against baselines in two multi-agent environments: Doors,
Keys, and Gems, as well as Overcooked. Our results suggest that
state-of-the-art large language and reasoning models fall short of
communicating feedback that is both contextually grounded and well-timed -
leading to higher communication overhead and task speedup. In contrast, ProToM
provides targeted and helpful feedback, achieving a higher success rate,
shorter task completion times, and is consistently preferred by human users.
Ссылки и действия
Дополнительные ресурсы: