Hacking Hallucinations of MLLMs with Causal Sufficiency and Necessity

2508.04182v1 cs.CL, cs.AI 2025-08-09
Авторы:

Peizheng Guo, Jingyao Wang, Wenwen Qiang, Huijie Guo, Changwen Zheng, Jiahuan Zhou, Gang Hua

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Multimodal Large Language Models (MLLMs) представляют собой передовые инструменты, способные выполнять сложные задачи в области визуально-языкового анализа. Они сочетают в себе текстовую и визуальную моделирование, что позволяет им эффективно решать задачи, такие как вопросов-ответов на основе изображений, описание изображений и подписание сцен. Однако, несмотря на их впечатляющие результаты, MLLMs часто сталкиваются с проблемой генерации неточных или неконсистентных выходных данных, известной как "hallucinations". Эти ошибки могут проявляться в виде опущений (отсутствие ключевых деталей) или фабрикации (генерация несуществующих фактов), что существенно ограничивает эффективность их применения в реальных сценариях. Корень проблемы лежит в том, что MLLMs могут недостаточно учитывать важные причинные факторы при генерации ответов. Недостаточность причинного анализа может приводить к опущению важных деталей, тогда как неправильное восприятие не-причинных сигналов может вызывать фабрикацию. Таким образом, для улучшения точности и надежности MLLMs необходимо разработать методы, которые бы учитывали причинные связи между входными данными и генерируемыми выходами. ## ПРЕДЛОЖЕННЫЙ МЕТОД Чтобы решить проблему генерации неточных выходных данных, авторы предлагают новый метод, основанный на reinforcement learning (RL) и причинном анализе. Основная идея заключается в том, чтобы оптимизировать модель так, чтобы она генерировала токены, которые являются как причинно достаточными, так и причинно необходимыми для корректного ответа. Для этого используется понятие "causal completeness" (причинная полнота), которое оценивает каждый токен по двум критериям: 1. **Causal Sufficiency** (причинная достаточность): определяет, может ли токен быть сгенерирован на основе входных данных без необходимости дополнительной информации. 2. **Causal Necessity** (причинная необходимость): оценивает, насколько незаменим токен для корректного ответа, используя контрфактуальный анализ. Эти критерии используются для построения reward function, который оптимизируется с помощью GRPO (Generalized Reward Policy Optimization) framework. Этот подход позволяет модели сосредоточиться на генерации токенов, которые не только соответствуют входным данным, но и являются причинно полными, что помогает избежать ошибок в виде опущений и фабрикации. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели ряд экспериментов на различных датасетах, чтобы продемонстрировать эффективность их подхода. Используемые данные включали различные визуально-языковые датасеты, такие как COCO Captions и Visual Genome. Результаты показали, что модель, обученная с использованием предложенного метода, значительно снизила частоту hallucinations по сравнению с базовыми моделями. Кроме того, были проведены сравнения с другими методами понижения hallucinations, и предложенный метод показал лучшие результаты в терминах качества генерации и согласованности выходных данных. Эти результаты подтверждают, что интеграция причинного анализа в процесс обучения MLLMs может значительно повысить их надежность и точность. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод имеет широкое применение в различных областях, где точность и надежность генерации выходных данных играют ключевую роль. Например, в области медицинской диагностики, где MLLMs могут использоваться для анализа медицинских изображений и генерации отчетов, точность является критически важной. Также, этот метод может быть полезен в областях автономных транспортных систем, где необходимо точно интерпретировать визуальные данные для принятия решений. Преимущества этого подхода включают в себя не только повышение точности генерации, но и повышение доверия пользователей к моделям, что может способствовать ширей их интеграции в реальные приложения. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В работе было показано, что использование причинного анализа и reinforcement learning может значительно повысить качество генерации в MLLMs, уменьшая частоту hallucinations. Однако, эти результаты также открывают новые направления для будущих исследований. Например, можно исследовать, как этот подход может быть адаптирован для других типов моделей или для задач, не связанных с визуально-языковым анализом. Также, важно исследовать, как этот метод может быть интегрирован в более крупные системы, чтобы обеспечить еще большую надежность и точность.

Abstract

Multimodal Large Language Models (MLLMs) have demonstrated impressive capabilities across vision-language tasks. However, they may suffer from hallucinations--generating outputs that are semantically inconsistent with the input image or text. Through causal analyses, we find that: (i) hallucinations with omission may arise from the failure to adequately capture essential causal factors, and (ii) hallucinations with fabrication are likely caused by the model being misled by non-causal cues. To address these challenges, we propose a novel reinforcement learning framework guided by causal completeness, which jointly considers both causal sufficiency and causal necessity of tokens. Specifically, we evaluate each token's standalone contribution and counterfactual indispensability to define a token-level causal completeness reward. This reward is used to construct a causally informed advantage function within the GRPO optimization framework, encouraging the model to focus on tokens that are both causally sufficient and necessary for accurate generation. Experimental results across various benchmark datasets and tasks demonstrate the effectiveness of our approach, which effectively mitigates hallucinations in MLLMs.

Ссылки и действия