AgentCTG: Harnessing Multi-Agent Collaboration for Fine-Grained Precise Control in Text Generation
2509.13677v1
cs.CL, cs.AI, cs.HC
2025-09-19
Авторы:
Xinxu Zhou, Jiaqi Bai, Zhenqi Sun, Fanxiang Zeng, Yue Liu
Резюме на русском
#### Контекст
В области естественного языкового процессинга (NLP), значительные успехи были достигнуты в задачах, таких как семантическое понимание текста, перевод и синтез речи. Однако задача Контролируемого Текстового Генерирования (Controlled Text Generation, CTG) все еще сталкивается с рядом проблем, в том числе с трудностью достичь точного управления в тексте. Эта сложность усиливается при применении в реальных сценариях, где необходимо учитывать затраты, масштабируемость, осуществление обучения на основе доменных знаний и достижение более точного контроля. Такие ограничения становятся ключевыми мотивациями для развития новых подходов, которые позволят значительно улучшить точность управления в тексте.
#### Метод
Предлагаемая модель AgentCTG основывается на подходе, использующем многоагентную коллаборацию, с полностью симулируемыми механизмами управления и регулирования. Она включает в себя два основных компонента: агента-генератора и агента-редактора. Агент-генератор стремится произвести оригинальный текст, который соответствует входным условиям, в то время как агент-редактор вносит дополнительные изменения, чтобы добиться точного соответствия текстовому контролю. Для более эффективного управления агентами вводится модуль автоматической подсказки (auto-prompt). Эта концепция позволяет направлять генерацию в нужном направлении, улучшая точность и контекстуальную адекватность. Архитектура AgentCTG базируется на структуре с несколькими слоями взаимодействия, чтобы обеспечить более эффективное взаимодействие между агентами.
#### Результаты
AgentCTG протестирована на нескольких популярных данных в области CTG, включая предложения с подробными условиями управления. Результаты показали, что модель демонстрирует значительное улучшение в точности контроля, выполняя лучше, чем предшествующие модели. Особое внимание уделено новой Character-Driven Rewriting задаче, где AgentCTG должна преобразовывать текст, соответствующий определенным характеристикам персонажа, при этом сохраняя доменные знания. Модель демонстрирует высокую точность в создании текста, который был успешно проверен как на целевых данных, так и в задачах, требующих дополнительного контекстуального понимания.
#### Значимость
Продемонстрированная модель AgentCTG имеет широкое применение в многочисленных областях, включая синтез речи, создание текста для навигационных систем, а также создание текста в онлайн-играх. Одним из основных преимуществ AgentCTG является ее масштабируемость и гибкость при многоагентной коллаборации, что позволяет ей удовлетворять разные потребности в контроле. Благодаря улу
Abstract
Although significant progress has been made in many tasks within the field of
Natural Language Processing (NLP), Controlled Text Generation (CTG) continues
to face numerous challenges, particularly in achieving fine-grained conditional
control over generation. Additionally, in real scenario and online
applications, cost considerations, scalability, domain knowledge learning and
more precise control are required, presenting more challenge for CTG. This
paper introduces a novel and scalable framework, AgentCTG, which aims to
enhance precise and complex control over the text generation by simulating the
control and regulation mechanisms in multi-agent workflows. We explore various
collaboration methods among different agents and introduce an auto-prompt
module to further enhance the generation effectiveness. AgentCTG achieves
state-of-the-art results on multiple public datasets. To validate its
effectiveness in practical applications, we propose a new challenging
Character-Driven Rewriting task, which aims to convert the original text into
new text that conform to specific character profiles and simultaneously
preserve the domain knowledge. When applied to online navigation with
role-playing, our approach significantly enhances the driving experience
through improved content delivery. By optimizing the generation of contextually
relevant text, we enable a more immersive interaction within online
communities, fostering greater personalization and user engagement.
Ссылки и действия
Дополнительные ресурсы: