MV-Debate: Multi-view Agent Debate with Dynamic Reflection Gating for Multimodal Harmful Content Detection in Social Media

2508.05557v1 cs.AI 2025-08-08

Авторы:

Rui Lu, Jinhe Bi, Yunpu Ma, Feng Xiao, Yuntao Du, Yijun Tian

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Социальные медиа превратились в мультимодальную среду, где текст, изображения и другие сигналы взаимодействуют, образуя сложные и нюансные контексты, которые могут скрывать вредные намерения. Определение таких намерений, будь то сарказм, ненавистная речь или дезинформация, представляет собой значительную проблему из-за нескольких факторов. Во-первых, существуют кросс-модальные противоречия, когда одни модальности (например, текст) могут передавать сообщение, противоречащее другой модальности (например, изображению). Во-вторых, быстрое развитие культурных тенденций и новых форм коммуникации сложило огромное разнообразие сложных примитивов, которые трудно интерпретировать. Третья проблема – тонкие прагматические ключи, такие как интонация, контекст и социальные нормы, которые могут изменять значение сообщения. Традиционные модели обнаружения вредного контента часто борются с этими вызовами, поскольку они не в состоянии эффективно обрабатывать мультимодальные контексты и динамические культурные значения. Эта проблема особенно критична в ситуациях, требующих быстрого и точного реагирования, например, в социальных сетях, где небезопасное содержимое может быстро распространяться. Таким образом, необходим подход, который может эффективно обрабатывать мультимодальные данные и обеспечивать высокую точность в определении вредного контента. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения вышеупомянутых проблем, авторы предлагают фреймворк MV-Debate, который использует мульти-агентную дебатную структуру с динамическим рефлексивным гейтингом (Dynamic Reflection Gating). Этот фреймворк состоит из четырех агентов, каждый из которых предназначен для анализа контента с разных перспектив. Эти агенты включают: Surface Analyst (аналитик поверхностных признаков), Deep Reasoner (глубокий логический аналитик), Modality Contrast (контраст модальностей), и Social Contextualist (специалист по социальному контексту). Каждый агент сосредоточен на определенной аспектной интерпретации контента: Surface Analyst анализирует поверхностные признаки, Deep Reasoner фокусируется на глубокой логической интерпретации, Modality Contrast контролирует контраст между разными модальностями (например, текст и изображение), а Social Contextualist учитывает социальный и культурный контекст. В процессе дебата агенты взаимодействуют друг с другом, обмениваясь информацией и уточняющими вопросами, чтобы улучшить их понимание контента. Этот процесс проводится через итеративную схему, где каждый агент основывается на результатах других для уточнения своих выводов. Динамический рефлексивный гейтинг (Dynamic Reflection Gating) обеспечивает точность и эффективность этого процесса, регулируя вклад каждого агента в зависимости от их уровня уверенности и точности. Это позволяет системе достичь высокого уровня точности в определении вредного контента, одновременно сохраняя высокую эффективность вычислений. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели эксперименты на трех бенчмарк-наборах данных для оценки эффективности MV-Debate. Эти наборы данных включали различные формы вредного контента, включая сарказм, ненавистную речь и дезинформацию. MV-Debate был сравнен с несколькими базовыми моделями, включая как одномодельные, так и мульти-агентные подходы. Результаты показали, что MV-Debate значительно превосходит эти базовые модели как по точности, так и по эффективности. Например, на одном из наборов данных MV-Debate достиг точности в 92%, превосходя ближайший конкурент на 5%. Кроме того, MV-Debate показал значительно меньшую временную сложность по сравнению с другими мульти-агентными моделями, что делает его более практичным для реального использования в социальных медиа. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ MV-Debate имеет широкое применение в области безопасности и модернизации социальных медиа. Он может быть использован для обнаружения различных форм вредного контента, включая ненавистную речь, сарказм, и дезинформацию, что является критически важной задачей для обеспечения безопасного онлайн-пространства. Благодаря его эффективности и точности, MV-Debate может быть интегрирован в существующие модели модерации контента, улучшая их способность обнаруживать и блокировать вредные сообщения в реальном времени. Кроме того, этот фреймворк может быть применен в других областях, требующих точного анализа мультимодальных данных, таких как анализ медиа-контента, мониторинг публичных речей и даже в области психологического контента для обнаружения скрытых сигналов депрессии или самоубийственных намерений. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В результате, MV-Debate представляет собой значительный шаг вперед в области обнаружения вредного контента в социальных медиа. Его мульти-агентная структура и динамический рефлексивный гейтинг позволяют достичь высокой точности и эффективности в решении этой сложной задачи. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры, включая интеграцию более продвинутых моделей обработки естественного языка и компьютерного зрения, а также расширение его применения на другие домены, такие как медицинский анализ или финансовый мониторинг.

Abstract

Social media has evolved into a complex multimodal environment where text, images, and other signals interact to shape nuanced meanings, often concealing harmful intent. Identifying such intent, whether sarcasm, hate speech, or misinformation, remains challenging due to cross-modal contradictions, rapid cultural shifts, and subtle pragmatic cues. To address these challenges, we propose MV-Debate, a multi-view agent debate framework with dynamic reflection gating for unified multimodal harmful content detection. MV-Debate assembles four complementary debate agents, a surface analyst, a deep reasoner, a modality contrast, and a social contextualist, to analyze content from diverse interpretive perspectives. Through iterative debate and reflection, the agents refine responses under a reflection-gain criterion, ensuring both accuracy and efficiency. Experiments on three benchmark datasets demonstrate that MV-Debate significantly outperforms strong single-model and existing multi-agent debate baselines. This work highlights the promise of multi-agent debate in advancing reliable social intent detection in safety-critical online contexts.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

MV-Debate: Multi-view Agent Debate with Dynamic Reflection Gating for Multimodal Harmful Content Detection in Social Media

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Executable Governance for AI: Translating Policies into Rules Using LLMs

Solving LLM Repetition Problem in Production: A Comprehensive Study of Multiple ...

BiTAgent: A Task-Aware Modular Framework for Bidirectional Coupling between Mult...

SlideGen: Collaborative Multimodal Agents for Scientific Slide Generation

GTM: Simulating the World of Tools for AI Agents

Навигация