AgentCTG: Harnessing Multi-Agent Collaboration for Fine-Grained Precise Control in Text Generation

2509.13677v1 cs.CL, cs.AI, cs.HC 2025-09-19
Авторы:

Xinxu Zhou, Jiaqi Bai, Zhenqi Sun, Fanxiang Zeng, Yue Liu

Резюме на русском

#### Контекст В области естественного языкового процессинга (NLP), значительные успехи были достигнуты в задачах, таких как семантическое понимание текста, перевод и синтез речи. Однако задача Контролируемого Текстового Генерирования (Controlled Text Generation, CTG) все еще сталкивается с рядом проблем, в том числе с трудностью достичь точного управления в тексте. Эта сложность усиливается при применении в реальных сценариях, где необходимо учитывать затраты, масштабируемость, осуществление обучения на основе доменных знаний и достижение более точного контроля. Такие ограничения становятся ключевыми мотивациями для развития новых подходов, которые позволят значительно улучшить точность управления в тексте. #### Метод Предлагаемая модель AgentCTG основывается на подходе, использующем многоагентную коллаборацию, с полностью симулируемыми механизмами управления и регулирования. Она включает в себя два основных компонента: агента-генератора и агента-редактора. Агент-генератор стремится произвести оригинальный текст, который соответствует входным условиям, в то время как агент-редактор вносит дополнительные изменения, чтобы добиться точного соответствия текстовому контролю. Для более эффективного управления агентами вводится модуль автоматической подсказки (auto-prompt). Эта концепция позволяет направлять генерацию в нужном направлении, улучшая точность и контекстуальную адекватность. Архитектура AgentCTG базируется на структуре с несколькими слоями взаимодействия, чтобы обеспечить более эффективное взаимодействие между агентами. #### Результаты AgentCTG протестирована на нескольких популярных данных в области CTG, включая предложения с подробными условиями управления. Результаты показали, что модель демонстрирует значительное улучшение в точности контроля, выполняя лучше, чем предшествующие модели. Особое внимание уделено новой Character-Driven Rewriting задаче, где AgentCTG должна преобразовывать текст, соответствующий определенным характеристикам персонажа, при этом сохраняя доменные знания. Модель демонстрирует высокую точность в создании текста, который был успешно проверен как на целевых данных, так и в задачах, требующих дополнительного контекстуального понимания. #### Значимость Продемонстрированная модель AgentCTG имеет широкое применение в многочисленных областях, включая синтез речи, создание текста для навигационных систем, а также создание текста в онлайн-играх. Одним из основных преимуществ AgentCTG является ее масштабируемость и гибкость при многоагентной коллаборации, что позволяет ей удовлетворять разные потребности в контроле. Благодаря улу

Abstract

Although significant progress has been made in many tasks within the field of Natural Language Processing (NLP), Controlled Text Generation (CTG) continues to face numerous challenges, particularly in achieving fine-grained conditional control over generation. Additionally, in real scenario and online applications, cost considerations, scalability, domain knowledge learning and more precise control are required, presenting more challenge for CTG. This paper introduces a novel and scalable framework, AgentCTG, which aims to enhance precise and complex control over the text generation by simulating the control and regulation mechanisms in multi-agent workflows. We explore various collaboration methods among different agents and introduce an auto-prompt module to further enhance the generation effectiveness. AgentCTG achieves state-of-the-art results on multiple public datasets. To validate its effectiveness in practical applications, we propose a new challenging Character-Driven Rewriting task, which aims to convert the original text into new text that conform to specific character profiles and simultaneously preserve the domain knowledge. When applied to online navigation with role-playing, our approach significantly enhances the driving experience through improved content delivery. By optimizing the generation of contextually relevant text, we enable a more immersive interaction within online communities, fostering greater personalization and user engagement.

Ссылки и действия