Robot guide with multi-agent control and automatic scenario generation with LLM

2509.10317v1 cs.RO, cs.LG, 93C85, I.2.9; I.2.7; I.2.11 2025-09-16
Авторы:

Elizaveta D. Moskovskaya, Anton D. Moscowsky

Резюме на русском

## Контекст Область исследования сосредоточена на развитии интеллектуальных социальных роботов, в частности, на создании гибкой и натуральной системы управления роботом-гидом. Существующие проблемы включают в себя необходимость ручной настройки поведения робота, ограниченную гибкость и низкую природность взаимодействия с пользователями. Такие проблемы сподвигают разработчиков искать альтернативы, основывающиеся на автоматизации подготовки сценариев поведения с применением современных технологий, таких как Лангуаже Модели (LLM). Развитие роботов-гидов является важной задачей в рамках развития робототехники, так как эти системы могут применяться в различных областях, включая туризм, образование и развлечения. Мотивацией является необходимость создания системы, которая обеспечивала бы динамическую адаптацию, натуральность взаимодействия и эффективность в эксплуатации. ## Метод Разработанная система основывается на сочетании двух основных компонентов: многоагентной системы управления ресурсами и автоматической генерации сценариев поведения с помощью Лангуаже Модели. В первой стадии генерации сценария создается стилизованный текстовый рисунок, описывающий основные моменты экскурсии. Затем, во второй стадии, внедряются невербальные действия, такие как повороты головы и жесты, в текст, чтобы сделать поведение робота более живым и натуральным. Многоагентная архитектура решает проблему координации параллельных действий робота, обеспечивает разрешение конфликтов и обратную связь за счет возврата к дефолтному поведению после завершения основных операций. Это гарантирует более естественное и понятное поведение робота в различных сценариях. ## Результаты Проведенные эксперименты показали высокую эффективность предложенного подхода. Были проанализированы данные, полученные в ходе испытаний, в которых робот-гид демонстрировал свои возможности в реальной среде. Эксперименты подтвердили улучшение натуральности поведения робота, более эффективное выполнение множества параллельных задач, а также высокую универсальность системы в различных условиях. Данные подтверждают, что автоматическая генерация сценариев поведения с помощью Лангуаже Модели позволяет создавать природные и эффективные коммуникации между роботом и пользователями. ## Значимость Предложенная система может быть применена в различных сферах, включая туристические экскурсии, образовательные центры, торговые площадки и развлекательные парки. Основное преимущество заключается в автоматизации процесса подготовки

Abstract

The work describes the development of a hybrid control architecture for an anthropomorphic tour guide robot, combining a multi-agent resource management system with automatic behavior scenario generation based on large language models. The proposed approach aims to overcome the limitations of traditional systems, which rely on manual tuning of behavior scenarios. These limitations include manual configuration, low flexibility, and lack of naturalness in robot behavior. The process of preparing tour scenarios is implemented through a two-stage generation: first, a stylized narrative is created, then non-verbal action tags are integrated into the text. The multi-agent system ensures coordination and conflict resolution during the execution of parallel actions, as well as maintaining default behavior after the completion of main operations, contributing to more natural robot behavior. The results obtained from the trial demonstrate the potential of the proposed approach for automating and scaling social robot control systems.

Ссылки и действия