Interactive Recommendation Agent with Active User Commands

2509.21317v1 cs.IR, cs.CL, cs.HC 2025-09-27
Авторы:

Jiakai Tang, Yujie Luo, Xunke Xi, Fei Sun, Xueyang Feng, Sunhao Dai, Chao Yi, Dian Chen, Zhujin Gao, Yang Li, Xu Chen, Wen Chen, Jian Wu, Yuning Jiang, Bo Zheng

Резюме на русском

## Контекст Современные системы рекомендаций основываются на пассивных механизмах обратной связи, ограничивающих пользователей до базовых вариантов, таких как "лайк" или "дизлайк". Эти простые отзывы не позволяют тщательно расследовать потребности и предпочтения пользователей. Таким образом, рекомендательные системы не могут точно определить, какие конкретные атрибуты товаров или сервисов влияют на удовлетворенность пользователей. Это приводит к ухудшению моделирования предпочтений и, в итоге, к снижению эффективности системы и уменьшению удовлетворенности пользователей. Этот проблемный аспект требует развития новых подходов, которые позволят лучше понять пользователей и улучшить рекомендации. ## Метод Мы предлагаем Interactive Recommendation Feed (IRF) — парадигму, в которой пользователи могут взаимодействовать с рекомендательными системами с помощью естественного языка. Такой подход позволяет пользователям напрямую контролировать рекомендации с помощью реального времени запросов в естественной форме языка. Для реализации этой идеи мы разработали RecBot, двухагентную архитектуру, в которой Parser Agent разбирает естественный язык команд в структурированные предпочтения, а Planner Agent адаптивно меняет политику рекомендации в зависимости от этих предпочтений. Для рациональной реализации в реальном мире мы применяем методы симуляционного знания для эффективного обучения и применения. Это позволяет IRF работать не только на основе данных, но и с учетом реальных факторов взаимодействия. ## Результаты Мы провести несколько экспериментов, обучая RecBot с помощью разных наборов данных и оценили его эффективность. На обучающих этапах мы использовали синтетические данные, а затем провели тестирование в реальной среде. RecBot показал существенные улучшения в удовлетворенности пользователей и в показателях бизнес-отдачи в сравнении с традиционными методами. Наши результаты показали, что пользователи активно используют возможность динамического управления рекомендациями, что приводит к лучшей корреляции рекомендаций с нуждами пользователей. Эти результаты подтверждают, что IRF может значительно повысить эффективность рекомендательных систем. ## Значимость Интерактивная система рекомендаций IRF может быть применена в различных сферах, таких как маркетинг, сервисы поддержки или интеллектуальные системы управления. Особым преимуществом является возможность активного управления рекомендациями, что повышает удовлетворенность пользователей и улучшает бизнес-результаты. Этот подход также может помочь системам быть более прозрачными и удобными для пользователей, что в целом повысит доверие к технологии. Мы в

Abstract

Traditional recommender systems rely on passive feedback mechanisms that limit users to simple choices such as like and dislike. However, these coarse-grained signals fail to capture users' nuanced behavior motivations and intentions. In turn, current systems cannot also distinguish which specific item attributes drive user satisfaction or dissatisfaction, resulting in inaccurate preference modeling. These fundamental limitations create a persistent gap between user intentions and system interpretations, ultimately undermining user satisfaction and harming system effectiveness. To address these limitations, we introduce the Interactive Recommendation Feed (IRF), a pioneering paradigm that enables natural language commands within mainstream recommendation feeds. Unlike traditional systems that confine users to passive implicit behavioral influence, IRF empowers active explicit control over recommendation policies through real-time linguistic commands. To support this paradigm, we develop RecBot, a dual-agent architecture where a Parser Agent transforms linguistic expressions into structured preferences and a Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly policy adjustment. To enable practical deployment, we employ simulation-augmented knowledge distillation to achieve efficient performance while maintaining strong reasoning capabilities. Through extensive offline and long-term online experiments, RecBot shows significant improvements in both user satisfaction and business outcomes.

Ссылки и действия

Связанные статьи

Agentic AutoSurvey: Let LLMs Survey LLMs

## Контекст Современные научные исследования сталкиваются с возрастающими вызовами в синтезе знаний в условиях быстро ме...

2025-09-25