Free-MAD: Consensus-Free Multi-Agent Debate
2509.11035v1
cs.AI, cs.CR
2025-09-17
Авторы:
Yu Cui, Hang Fu, Haibin Zhang, Licheng Wang, Cong Zuo
Резюме на русском
#### Контекст
Многоагентные дебаты (MAD, Multi-Agent Debate) являются перспективным подходом к улучшению резолюционных способностей больших языковых моделей (LLMs). Эти методы построены на интерактивной коммуникации множества агентов, которые стремятся к выработке согласия на ответ на заданный вопрос. Однако существующие MAD-системы страдают от нескольких ограничений. Во-первых, многократные обороты обмена сообщениями увеличивают накладные расходы в виде токенов и снижают масштабируемость. Во-вторых, LLMs чувствительны к социальному влиянию, что приводит к ошибкам в рассуждениях и их распространению посредством консенсуса. В-третьих, множественный дефект большинства при многократных голосованиях приводит к случайности и неравенству в решениях.
#### Метод
Чтобы устранить эти проблемы, мы предлагаем **Free-MAD** — новую модель MAD, которая убирает необходимость в консенсусе между агентами. Механизм **Free-MAD** основывается на оценке всего дебатного траектории, а не только последней итерации. Это позволяет более точно использовать развитие разума каждого агента при выводе ответа. Для того чтобы снизить влияние консенсуса и улучшить справедливость решения, мы ввели понятие **anti-conformity** — специальную механику, которая позволяет агентам противостоять групповой согласованности и избегать лишних ошибок. Это приводит к более сбалансированным и точным выводам.
#### Результаты
Мы проверили Free-MAD на восьми различных бенчмарк-датасетах. Результаты показали, что Free-MAD не только повышает точность рассуждений, но и сокращает потребление токенов, так как у него только одна итерация дебата. Благодаря отсутствию консенсуса и применению anti-conformity, Free-MAD демонстрирует высокую устойчивость к атакам, когда данные вводятся специально для того, чтобы сбить модель с толку.
#### Значимость
Предложенный подход может быть применен в различных областях, где необходима скорая, точность и справедливость вывода: от генерации ответов в системах разметки данных до решения задач сложного анализа в любой области. Free-MAD значительно сокращает стоимость и время вычислений, а также улучшает надежность в условиях реальной атаки. Это делает его привлекательным для применения в реальных системах, где требуется высокая эффективность и правосудие.
#### Выводы
Мы представили Free-MAD, новую модель MAD, которая эффективно работает без консенсуса и использует anti-conformity для повышения точности и справедливости. Наши результаты показывают, что Free-MAD превосходит существующие методы в своей области, предлагая новый подход к многоагентным дебатам. Будущие исследовани
Abstract
Multi-agent debate (MAD) is an emerging approach to improving the reasoning
capabilities of large language models (LLMs). Existing MAD methods rely on
multiple rounds of interaction among agents to reach consensus, and the final
output is selected by majority voting in the last round. However, this
consensus-based design faces several limitations. First, multiple rounds of
communication increases token overhead and limits scalability. Second, due to
the inherent conformity of LLMs, agents that initially produce correct
responses may be influenced by incorrect ones during the debate process,
causing error propagation. Third, majority voting introduces randomness and
unfairness in the decision-making phase, and can degrade the reasoning
performance.
To address these issues, we propose \textsc{Free-MAD}, a novel MAD framework
that eliminates the need for consensus among agents. \textsc{Free-MAD}
introduces a novel score-based decision mechanism that evaluates the entire
debate trajectory rather than relying on the last round only. This mechanism
tracks how each agent's reasoning evolves, enabling more accurate and fair
outcomes. In addition, \textsc{Free-MAD} reconstructs the debate phase by
introducing anti-conformity, a mechanism that enables agents to mitigate
excessive influence from the majority. Experiments on eight benchmark datasets
demonstrate that \textsc{Free-MAD} significantly improves reasoning performance
while requiring only a single-round debate and thus reducing token costs. We
also show that compared to existing MAD approaches, \textsc{Free-MAD} exhibits
improved robustness in real-world attack scenarios.
Ссылки и действия
Дополнительные ресурсы: