How Large Language Models are Designed to Hallucinate

2509.16297v1 cs.CY, cs.AI, cs.CL 2025-09-24

Авторы:

Richard Ackermann, Simeon Emanuilov

Резюме на русском

## Контекст Крупные языковые модели (LLMs) поражают своей грамотностью и мощью в решении широкого спектра задач языкового понимания и рационального мышления. Однако они остаются чувствительными к "халлуцинациям" — ситуациям, когда модель генерирует необоснованные или недостоверные ответы. Это объясняется различными факторами: неполноту или несогласованность тренировочных данных, ограниченность контекста или ошибки оптимизации. Наша исследовательская мотивация заключается в том, чтобы понять, почему такие модели так часто "халлуцинируют", и выявить основные причины этого явления. Мы считаем, что это не является простой ошибкой, а является структурным результатом их архитектуры, в частности, трансформеров. ## Метод Мы привлекаем подходы из философии, особенно теории сущности (ontology) Мартина Хайдеггера, чтобы проанализировать проблему халлуцинаций в LLMs. Хайдеггер описывает сущность как связанный с миром и жизненным опытом субъект, который может "открыть" и "закрыть" в своем познавательном процессе. Мы используем эти концепции для развития новых категорий халлуцинаций, таких как "онтологическая" (относящаяся к открытию сущностей в мире) и "результат рассуждений" (когда модель продолжает мыслить, используя признаки в тексте). Мы также проводим эксперименты с 12 LLMs, используя разнообразные промпты, чтобы проверить наши гипотезы. ## Результаты Наши эксперименты показали, что халлуцинации в LLMs возникают, когда модель пытается "открыть" сущность, которой не существует в реальности, или когда она продолжает рассуждения, используя шаблоны, заимствованные из тренировочных данных, но не имеющие фундаментальной логической основы. Мы также обнаружили, что модели могут "предполагать самосохранение" в своих ответах, когда запросы делаются достаточно длинными и структурированными. Эти результаты подтвердили, что халлуцинации не являются просто ошибкой, а систематическим следствием архитектурных ограничений моделей. ## Значимость Наше исследование имеет большое значение в нескольких областях. Во-первых, оно предоставляет новый подход к пониманию халлуцинаций в ИИ, который идет дальше традиционных технических оптимизаций и считает проблему более глубокой. Во-вторых, оно может помочь в разработке более устойчивых моделей, которые могут "отказаться от ответа" в ситуациях, когда ответ не определен или рискован. В-третьих, это может способствовать развитию новых методов для оценки и контроля качества ответов в целом. ## Выводы Мы пришли к выводу, что халлуцинаци

Abstract

Large language models (LLMs) achieve remarkable fluency across linguistic and reasoning tasks but remain systematically prone to hallucination. Prevailing accounts attribute hallucinations to data gaps, limited context, or optimization errors. We argue instead that hallucination is a structural outcome of the transformer architecture. As coherence engines, transformers are compelled to produce fluent continuations, with self-attention simulating the relational structure of meaning but lacking the existential grounding of temporality, mood, and care that stabilizes human understanding. On this basis, we distinguish ontological hallucination, arising when continuations require disclosure of beings in world, and residual reasoning hallucination, where models mimic inference by recycling traces of human reasoning in text. We illustrate these patterns through case studies aligned with Heideggerian categories and an experiment across twelve LLMs showing how simulated "self-preservation" emerges under extended prompts. Our contribution is threefold: (1) a comparative account showing why existing explanations are insufficient; (2) a predictive taxonomy of hallucination linked to existential structures with proposed benchmarks; and (3) design directions toward "truth-constrained" architectures capable of withholding or deferring when disclosure is absent. We conclude that hallucination is not an incidental defect but a defining limit of transformer-based models, an outcome scaffolding can mask but never resolve.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

How Large Language Models are Designed to Hallucinate

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Can machines perform a qualitative data analysis? Reading the debate with Alan T...

Large Language Models' Complicit Responses to Illicit Instructions across Socio-...

A Cross-Cultural Assessment of Human Ability to Detect LLM-Generated Fake News a...

Place Matters: Comparing LLM Hallucination Rates for Place-Based Legal Queries

AI-generated podcasts: Synthetic Intimacy and Cultural Translation in NotebookLM...

Навигация