Free-MAD: Consensus-Free Multi-Agent Debate

2509.11035v1 cs.AI, cs.CR 2025-09-17
Авторы:

Yu Cui, Hang Fu, Haibin Zhang, Licheng Wang, Cong Zuo

Резюме на русском

#### Контекст Многоагентные дебаты (MAD, Multi-Agent Debate) являются перспективным подходом к улучшению резолюционных способностей больших языковых моделей (LLMs). Эти методы построены на интерактивной коммуникации множества агентов, которые стремятся к выработке согласия на ответ на заданный вопрос. Однако существующие MAD-системы страдают от нескольких ограничений. Во-первых, многократные обороты обмена сообщениями увеличивают накладные расходы в виде токенов и снижают масштабируемость. Во-вторых, LLMs чувствительны к социальному влиянию, что приводит к ошибкам в рассуждениях и их распространению посредством консенсуса. В-третьих, множественный дефект большинства при многократных голосованиях приводит к случайности и неравенству в решениях. #### Метод Чтобы устранить эти проблемы, мы предлагаем **Free-MAD** — новую модель MAD, которая убирает необходимость в консенсусе между агентами. Механизм **Free-MAD** основывается на оценке всего дебатного траектории, а не только последней итерации. Это позволяет более точно использовать развитие разума каждого агента при выводе ответа. Для того чтобы снизить влияние консенсуса и улучшить справедливость решения, мы ввели понятие **anti-conformity** — специальную механику, которая позволяет агентам противостоять групповой согласованности и избегать лишних ошибок. Это приводит к более сбалансированным и точным выводам. #### Результаты Мы проверили Free-MAD на восьми различных бенчмарк-датасетах. Результаты показали, что Free-MAD не только повышает точность рассуждений, но и сокращает потребление токенов, так как у него только одна итерация дебата. Благодаря отсутствию консенсуса и применению anti-conformity, Free-MAD демонстрирует высокую устойчивость к атакам, когда данные вводятся специально для того, чтобы сбить модель с толку. #### Значимость Предложенный подход может быть применен в различных областях, где необходима скорая, точность и справедливость вывода: от генерации ответов в системах разметки данных до решения задач сложного анализа в любой области. Free-MAD значительно сокращает стоимость и время вычислений, а также улучшает надежность в условиях реальной атаки. Это делает его привлекательным для применения в реальных системах, где требуется высокая эффективность и правосудие. #### Выводы Мы представили Free-MAD, новую модель MAD, которая эффективно работает без консенсуса и использует anti-conformity для повышения точности и справедливости. Наши результаты показывают, что Free-MAD превосходит существующие методы в своей области, предлагая новый подход к многоагентным дебатам. Будущие исследовани

Abstract

Multi-agent debate (MAD) is an emerging approach to improving the reasoning capabilities of large language models (LLMs). Existing MAD methods rely on multiple rounds of interaction among agents to reach consensus, and the final output is selected by majority voting in the last round. However, this consensus-based design faces several limitations. First, multiple rounds of communication increases token overhead and limits scalability. Second, due to the inherent conformity of LLMs, agents that initially produce correct responses may be influenced by incorrect ones during the debate process, causing error propagation. Third, majority voting introduces randomness and unfairness in the decision-making phase, and can degrade the reasoning performance. To address these issues, we propose \textsc{Free-MAD}, a novel MAD framework that eliminates the need for consensus among agents. \textsc{Free-MAD} introduces a novel score-based decision mechanism that evaluates the entire debate trajectory rather than relying on the last round only. This mechanism tracks how each agent's reasoning evolves, enabling more accurate and fair outcomes. In addition, \textsc{Free-MAD} reconstructs the debate phase by introducing anti-conformity, a mechanism that enables agents to mitigate excessive influence from the majority. Experiments on eight benchmark datasets demonstrate that \textsc{Free-MAD} significantly improves reasoning performance while requiring only a single-round debate and thus reducing token costs. We also show that compared to existing MAD approaches, \textsc{Free-MAD} exhibits improved robustness in real-world attack scenarios.

Ссылки и действия