Hallucination as a Computational Boundary: A Hierarchy of Inevitability and the Oracle Escape
2508.07334v1
cs.AI
2025-08-13
Авторы:
Quan Shi, Wang Xi, Zenghui Ding, Jianqing Gao, Xianjun Yang
Резюме на русском
## Контекст
Ложная информация, или "хэллуцинация", является основной проблемой в развитии бо LARGE LANGUAGE MODELS (LLMs). Это неопределенность в их прогностических выводах приводит к недоверию к их применению в реальной жизни. Несмотря на выдающиеся результаты в области генеративной лингвистики и глубокого обучения, нет ясного понимания того, почему ложная информация возникает и как её можно эффективно устранить. Бурно развивающиеся машинное обучение и искусственное интеллект поставляют новые возможности, но также и новые вызовы. Целью настоящего исследования является формализация проблемы ложной информации, изучение её основных причин и предложение решений.
## Метод
Мы прибегаем к методологии формализации ложной информации как проблемы бутстраппинга информации с использованием теории информации и теории игр. Рассматривается модель ложной информации в LLMs через теорию вероятностей и необходимости Тьюринга в силу необходимости знаний в алгоритмах обучения. Мы используем "ложную информацию" как целевую функцию в игровой теории, чтобы определить условия, при которых модель может вернуть ложные выводы. Также мы проводим эксперименты на множестве данных, включающих тексты на разных языках и специальные случаи, чтобы проверить эффективность теоретических моделей.
## Результаты
В результате исследования мы показали, что ложная информация возникает только в условиях определенного количества неопределенности в исходных данных. Мы провели эксперименты, показав, что если ложная информация возникает, она может быть обнаружена и устранена с помощью специальных методов, таких как модели Retrieval-Augmented Generations (RAGs). Мы также показали, что модели RAGs могут быть интерпретированы как "оракл-машины", которые могут предотвратить возникновение ложной информации, получая экстерных знаний. Использование теории игр позволяет формализовать поведение моделей и их взаимодействие с окружающей средой, что дает новый способ управления ложной информацией.
## Значимость
Наша работа имеет важное значение для обеспечения надежности и эффективности применения LLMs в реальной жизни. Она может быть применена в таких областях, как анализ текстов, генерация текста, медицинское применение, юридические исследования и другие, где ложная информация может привести к серьёзным последствиям. Также, мы установили, что модели RAGs могут быть использованы для устранения ложной информации и увеличения надежности систем. Наша работа также открывает новые пути к достижению устойчивости в LLMs, продвигая фо
Abstract
The illusion phenomenon of large language models (LLMs) is the core obstacle
to their reliable deployment. This article formalizes the large language model
as a probabilistic Turing machine by constructing a "computational necessity
hierarchy", and for the first time proves the illusions are inevitable on
diagonalization, incomputability, and information theory boundaries supported
by the new "learner pump lemma". However, we propose two "escape routes": one
is to model Retrieval Enhanced Generations (RAGs) as oracle machines, proving
their absolute escape through "computational jumps", providing the first formal
theory for the effectiveness of RAGs; The second is to formalize continuous
learning as an "internalized oracle" mechanism and implement this path through
a novel neural game theory framework.Finally, this article proposes a
Ссылки и действия
Дополнительные ресурсы: