Mitigating Hallucinations in Large Vision-Language Models by Self-Injecting Hallucinations

2509.11287v1 cs.CV, cs.CL 2025-09-17
Авторы:

Yifan Lu, Ziqi Zhang, Chunfeng Yuan, Jun Gao, Congxuan Zhang, Xiaojuan Qi, Bing Li, Weiming Hu

Резюме на русском

## Контекст Становятся все более популярными с LLM (Large Language Models) и LVLMs (Large Vision-Language Models). Однако, даже самые продвинутые системы LVLMs страдают от проблемы "халлуцинаций", когда их ответы не соответствуют визуальным входным данным. Эта проблема становится серьёзной ограничением для применения LVLMs в реальных задачах. Несмотря на существующие методы, такие как предпочтение согласования или внешние зависимости, эти подходы требуют дополнительных ресурсов, таких как человеческие аннотации или специальные модели, что делает процесс дорогостоящим и менее удобным. Наша статья уделяет внимание существующим проблемам в зоне LVLMs, предлагая новое, автономное решение, которое не требует внешних зависимостей и может стабильно улучшать производительность LVLMs в будущем. ## Метод Мы предлагаем метод **Autonomous Preference Alignment via Self-Injection (APASI)** для снижения халлуцинаций в LVLMs. Алгоритм APASI основывается на самозапуске халлуцинации в процессе генерации ответа. Именно это для нашей модели становится ключом к тому, чтобы она могла сама понять, какой ответ будет считаться "халлуцинацией" и что желательно изменить. Главным принципом APASI является имитация реальных халлуцинаций, что позволяет модели изучить их характеристики и стабильно их исправлять. Мы также внедряем стратегию итеративного обучения с помощью метода учебного курса, чтобы постоянно усиливать нагрузку на модель, чтобы она могла стабильно улучшаться в процессе обучения. ## Результаты В нашем исследовании мы использовали шесть разных бенчмарков, чтобы проверить эффективность APASI. Мы сравнили результаты этого метода с другими подходами, основывающимися на предпочтениях. Наши эксперименты показали, что APASI не только существенно снижает халлуцинации, но и достигает показателей, подобных или даже выше, чем существующие методы. Это указывает на то, что APASI не только эффективен в своей задаче, но также продемонстрировал способность улучшать LVLMs в реальной среде. ## Значимость Метод APASI может применяться в различных областях, где LVLMs могут использоваться, таких как распознавание объектов, описание визуального содержимого и даже в создании контента. Одним из основных преимуществ APASI является его автономность, что устраняет необходимость в дорогостоящих внешних зависимостях. Мы уверены, что наша работа может стать основой для дальнейших исследований в области LVLMs и помочь в решении проблем, связанных с халлуцинациями. ## Выводы Мы представили новый метод APASI для снижения халлуцинаций в LVLMs. Наш алгоритм не только стабильно улучшает производительность, но также демо

Abstract

Large Vision-Language Models (LVLMs) suffer from serious hallucination problems, where the model-generated responses are inconsistent with the visual inputs. Existing hallucination mitigation methods are mainly based on preference alignment and require external human annotations or auxiliary models for preference data collection, which increase costs and limit sustainable improvement. To tackle these challenges, we propose Autonomous Preference Alignment via Self-Injection (APASI), a novel and generalizable method that mitigates hallucinations without external dependencies. APASI leverages the target LVLM to self-inject hallucinations into a generated response, creating a pair of responses with varying preference levels. During the self-injection process, the dis-preferred response is generated based on three key observations of hallucinations, ensuring it simulates real hallucination patterns. This fidelity offers an accurate learning signal for hallucination mitigation. Moreover, APASI incorporates an iterative alignment training strategy combined with curriculum learning to periodically update the preference data with increasing challenge, enabling stable and continuous enhancement of the LVLM. Extensive experiments across six benchmarks show that APASI not only effectively mitigates hallucinations for three baseline models but also achieves comparable or even superior performance to alignment-based methods with external dependency, thereby demonstrating its effectiveness and generalization capability. The code is available at https://github.com/davidluciolu/APASI.

Ссылки и действия