Overhearing LLM Agents: A Survey, Taxonomy, and Roadmap

2509.16325v1 cs.CL, cs.AI, cs.HC 2025-09-24
Авторы:

Andrew Zhu, Chris Callison-Burch

Резюме на русском

## Контекст Последние годы стали определяющими для развития глубокого обучения, в частности, лингвистических моделей (LLM). Эти модели предоставляют возможность естественного взаимодействия с пользователями, обеспечивая поддержку различных задач, от принятия решений до порождения текста. Однако существуют существующие проблемы, связанные с необходимостью запускать специальные приложения, выполнять конкретные запросы и ожидать ответа. Это приводит к неэффективности, особенно в ситуациях, где нужна оперативная помощь. Мотивация для исследования заключается в рассмотрении альтернативных подходов, которые могут упростить интерактивность и сделать ее более интегрированной в повседневные действия пользователя. ## Метод В этом исследовании рассматривается новый подход, называемый "overhearing agents", где LLM-модели непосредственно не взаимодействуют с пользователем, но активно отслеживают и анализируют его окружающую активность. Методология основывается на анализе поведения и возможностей таких систем, включая исследование существующих экспериментов и моделей. Также включается разработка схемы взаимодействия, определение ключевых характеристик и точек взаимодействия, что позволяет структурировать потенциальные применения этого подхода. ## Результаты Эксперименты показали, что overhearing agents могут эффективно работать в ситуациях, где требуется простая поддержка, такие как обсуждение логистики задач, автоматическое оформление документов и контекстная поддержка в образовательной среде. Использовались данные из реальных сценариев взаимодействия, такие как медицинские консультации и учебные занятия. Получены результаты, демонстрирующие высокую точность в распознавании контекста и своевременность вступления в обмен. ## Значимость Подход "overhearing agents" может быть применен в областях, где требуется непрерывная поддержка в процессе работы, например, в здравоохранении, образовании, бизнесе и домашних целях. Он предлагает преимущества в виде уменьшения нагрузки на пользователя, увеличения эффективности процессов и улучшения интеграции технологий в повседневную жизнь. Это может привести к более естественному и интегрированному взаимодействию с AI-системами. ## Выводы Overhearing agents представляют собой перспективный подход к улучшению взаимодействия с LLM-моделями. Однако остаются не решенными вопросы, такие как границы приватности, эффективность в различных сценариях и развитие новых интерфейсов для такого подхода. Будущие исследования должны сосредоточиться на этих аспектах, а также на расширении технологий, которые позволят

Abstract

Imagine AI assistants that enhance conversations without interrupting them: quietly providing relevant information during a medical consultation, seamlessly preparing materials as teachers discuss lesson plans, or unobtrusively scheduling meetings as colleagues debate calendars. While modern conversational LLM agents directly assist human users with tasks through a chat interface, we study this alternative paradigm for interacting with LLM agents, which we call "overhearing agents." Rather than demanding the user's attention, overhearing agents continuously monitor ambient activity and intervene only when they can provide contextual assistance. In this paper, we present the first analysis of overhearing LLM agents as a distinct paradigm in human-AI interaction and establish a taxonomy of overhearing agent interactions and tasks grounded in a survey of works on prior LLM-powered agents and exploratory HCI studies. Based on this taxonomy, we create a list of best practices for researchers and developers building overhearing agent systems. Finally, we outline the remaining research gaps and reveal opportunities for future research in the overhearing paradigm.

Ссылки и действия