Interactive Program Synthesis for Modeling Collaborative Physical Activities from Narrated Demonstrations

2509.24250v1 cs.AI, cs.HC, cs.LG 2025-10-01
Авторы:

Edward Kim, Daniel He, Jorge Chao, Wiktor Rajca, Mohammed Amin, Nishant Malpani, Ruta Desai, Antti Oulasvirta, Bjoern Hartmann, Sanjit Seshia

Резюме на русском

## Контекст Учить системы выполнять физические задачи является давней целью в области Интерфейсов человека-компьютера (HCI). Однако большая часть предыдущих исследований сосредоточилась на неколлективных физических действиях. Коллективные задачи добавляют значительную сложность, так как система должна не только понять действия пользователя, но и предположения, которые этот пользователь делает о поведении своего коллеги. Это свойство сделает процесс взаимодействия взаимозависимым и неоднозначным. Решением этой проблемы может стать представление системного поведения в виде синтезированных программ, которые пользователи могут просматривать, исправлять и корректировать. Мы предлагаем подход, в котором пользователи могут учить систему коллективные физические задачи с помощью нотации действий через естественный язык, не требуя от них знания программирования. Наша цель — создать систему, которая позволит пользователям легко понимать, корректировать и взаимодействовать с системой для достижения коллективных целей. ## Метод Мы представляем обучение системы физических задач как задачу синтеза программ. Наша система представляет поведение в виде программ, которые могут быть легко редактированы пользователем. Мы используем нотацию, основанную на естественном языке, чтобы пользователи могли не только учить систему, но и корректировать ее поведение. Наша архитектура использует многомодальное взаимодействие, где пользователи могут общаться с системой через естественный язык. Мы акцентируем внимание на том, как система может представлять свой процесс обучения пользователям в простой и понятной форме. ## Результаты Мы провести эксперимент с 20 пользователями, которые пытались учить систему игровые тактики в мультиплеерном футболе. 70% участников (14 из 20) смогли улучшить программу, чтобы она соответствовала их намерениям, а 90% (18 из 20) нашли процесс корректировки программы простым и понятным. Эксперимент показал, что пользователи могут легко корректировать систему, но также выявил некоторые сложности в представлении процесса обучения в виде программ и в процессе обучения коллективных физических задач. ## Значимость Наш подход имеет широкие возможности для применения в области обучения систем коллективным физическим задачам. Он позволяет пользователям легко интерпретировать и корректировать поведение системы, что может быть полезно в различных областях, таких как обучение роботов, виртуальные реальности и другие приложения, требующие взаимодействия человека и системы. Мы также отмечаем, что наш подход может сильно повлиять на область HCI

Abstract

Teaching systems physical tasks is a long standing goal in HCI, yet most prior work has focused on non collaborative physical activities. Collaborative tasks introduce added complexity, requiring systems to infer users assumptions about their teammates intent, which is an inherently ambiguous and dynamic process. This necessitates representations that are interpretable and correctable, enabling users to inspect and refine system behavior. We address this challenge by framing collaborative task learning as a program synthesis problem. Our system represents behavior as editable programs and uses narrated demonstrations, i.e. paired physical actions and natural language, as a unified modality for teaching, inspecting, and correcting system logic without requiring users to see or write code. The same modality is used for the system to communicate its learning to users. In a within subjects study, 20 users taught multiplayer soccer tactics to our system. 70 percent (14/20) of participants successfully refined learned programs to match their intent and 90 percent (18/20) found it easy to correct the programs. The study surfaced unique challenges in representing learning as programs and in enabling users to teach collaborative physical activities. We discuss these issues and outline mitigation strategies.

Ссылки и действия

Связанные статьи

Dynamic Trust Calibration Using Contextual Bandits

## Контекст Оптимальное принятие решений в совместных сценариях человеко-компьютерных интеракций зависит от доверия, чет...

2025-10-01

HealthSLM-Bench: Benchmarking Small Language Models for Mobile and Wearable Heal...

## Контекст Mobile и wearable healthcare monitoring (МХЗ и ОХЗ мониторинг) являются критически важными для обнаружения з...

2025-09-11