Interactive Program Synthesis for Modeling Collaborative Physical Activities from Narrated Demonstrations
2509.24250v1
cs.AI, cs.HC, cs.LG
2025-10-01
Авторы:
Edward Kim, Daniel He, Jorge Chao, Wiktor Rajca, Mohammed Amin, Nishant Malpani, Ruta Desai, Antti Oulasvirta, Bjoern Hartmann, Sanjit Seshia
Резюме на русском
## Контекст
Учить системы выполнять физические задачи является давней целью в области Интерфейсов человека-компьютера (HCI). Однако большая часть предыдущих исследований сосредоточилась на неколлективных физических действиях. Коллективные задачи добавляют значительную сложность, так как система должна не только понять действия пользователя, но и предположения, которые этот пользователь делает о поведении своего коллеги. Это свойство сделает процесс взаимодействия взаимозависимым и неоднозначным. Решением этой проблемы может стать представление системного поведения в виде синтезированных программ, которые пользователи могут просматривать, исправлять и корректировать. Мы предлагаем подход, в котором пользователи могут учить систему коллективные физические задачи с помощью нотации действий через естественный язык, не требуя от них знания программирования. Наша цель — создать систему, которая позволит пользователям легко понимать, корректировать и взаимодействовать с системой для достижения коллективных целей.
## Метод
Мы представляем обучение системы физических задач как задачу синтеза программ. Наша система представляет поведение в виде программ, которые могут быть легко редактированы пользователем. Мы используем нотацию, основанную на естественном языке, чтобы пользователи могли не только учить систему, но и корректировать ее поведение. Наша архитектура использует многомодальное взаимодействие, где пользователи могут общаться с системой через естественный язык. Мы акцентируем внимание на том, как система может представлять свой процесс обучения пользователям в простой и понятной форме.
## Результаты
Мы провести эксперимент с 20 пользователями, которые пытались учить систему игровые тактики в мультиплеерном футболе. 70% участников (14 из 20) смогли улучшить программу, чтобы она соответствовала их намерениям, а 90% (18 из 20) нашли процесс корректировки программы простым и понятным. Эксперимент показал, что пользователи могут легко корректировать систему, но также выявил некоторые сложности в представлении процесса обучения в виде программ и в процессе обучения коллективных физических задач.
## Значимость
Наш подход имеет широкие возможности для применения в области обучения систем коллективным физическим задачам. Он позволяет пользователям легко интерпретировать и корректировать поведение системы, что может быть полезно в различных областях, таких как обучение роботов, виртуальные реальности и другие приложения, требующие взаимодействия человека и системы. Мы также отмечаем, что наш подход может сильно повлиять на область HCI
Abstract
Teaching systems physical tasks is a long standing goal in HCI, yet most
prior work has focused on non collaborative physical activities. Collaborative
tasks introduce added complexity, requiring systems to infer users assumptions
about their teammates intent, which is an inherently ambiguous and dynamic
process. This necessitates representations that are interpretable and
correctable, enabling users to inspect and refine system behavior. We address
this challenge by framing collaborative task learning as a program synthesis
problem. Our system represents behavior as editable programs and uses narrated
demonstrations, i.e. paired physical actions and natural language, as a unified
modality for teaching, inspecting, and correcting system logic without
requiring users to see or write code. The same modality is used for the system
to communicate its learning to users. In a within subjects study, 20 users
taught multiplayer soccer tactics to our system. 70 percent (14/20) of
participants successfully refined learned programs to match their intent and 90
percent (18/20) found it easy to correct the programs. The study surfaced
unique challenges in representing learning as programs and in enabling users to
teach collaborative physical activities. We discuss these issues and outline
mitigation strategies.
Ссылки и действия
Дополнительные ресурсы: