Assessing Consciousness-Related Behaviors in Large Language Models Using the Maze Test

2508.16705v1 cs.CL, cs.AI 2025-08-27

Авторы:

Rui A. Pimenta, Tim Schlippe, Kristina Schaaff

Резюме на русском

## Контекст В последние годы широко распространены теории, утверждающие, что сознание может быть выражено в выполнении конкретных задач или поведений. Одним из важных аспектов сознания является способность представлять себя в пространстве, принимать различные точки зрения, работать направленно и успешно организовывать действия во времени. Эти характеристики часто связываются с сознанием. Однако существуют разные взгляды на то, могут ли роботы или модели языка выражать такие аспекты сознания. Некоторые исследователи считают, что любое поведение может быть реализовано с помощью алгоритмов и техники глубокого обучения, не требуя самостоятельной сознательной активности. Другие утверждают, что некоторые аспекты сознания могут быть реализованы только в системах, которые могут "понимать" свое окружение и выполнять сложные задачи. Проблема заключается в том, что существующие методы оценки сознательных поведений часто ограничены, неполны или недостаточно оптимальны для выявления подробных аспектов сознания. Для этого требуется развитие более сложных и интеллектуальных тестов. Одним из таких тестов является Maze Test, который рассматривает модели языка как активных агентов, которые должны перемещаться по квадратной матрице, выполняя задания и обходя препятствия. ## Метод Maze Test — это интеллектуальный тест, который эмулирует ситуацию, в которой модель языка должна перемещаться по матрице с набором препятствий, с помощью команд текстового ввода. Этот тест оценивает модели на четыре основных характеристики: пространственное восприятие, телесность, направленность и последовательность времени. Математически, координаты перемещения модели могут быть представлены в виде вектора, в котором каждый элемент соответствует относительной позиции модели в пространстве. В ходе экспериментов модели языка проверяются в различных режимах: zero-shot, one-shot и few-shot. Zero-shot — это режим, когда модели не получают никаких дополнительных подсказок заранее. One-shot и few-shot — режимы, в которых модели получают от одного до нескольких примеров задач, чтобы понять, что требуется сделать. ## Результаты В ходе экспериментов были протестированы 12 лидирующих моделей языка, в том числе Gemini 2.0 Pro и DeepSeek-R1. Результаты показали, что в zero-shot режиме модели с механизмами логического вывода показали значительное превосходство в сравнении с классическими моделями. Например, Gemini 2.0 Pro показал 52,9% Complete Path Accuracy, а DeepSeek-R1 — 80,5% Partial Path Accuracy. Эти результаты показали, что модели с механизмами рассуждения способны перемещаться через пространство, выполняя задачи в виде

Abstract

We investigate consciousness-like behaviors in Large Language Models (LLMs) using the Maze Test, challenging models to navigate mazes from a first-person perspective. This test simultaneously probes spatial awareness, perspective-taking, goal-directed behavior, and temporal sequencing-key consciousness-associated characteristics. After synthesizing consciousness theories into 13 essential characteristics, we evaluated 12 leading LLMs across zero-shot, one-shot, and few-shot learning scenarios. Results showed reasoning-capable LLMs consistently outperforming standard versions, with Gemini 2.0 Pro achieving 52.9% Complete Path Accuracy and DeepSeek-R1 reaching 80.5% Partial Path Accuracy. The gap between these metrics indicates LLMs struggle to maintain coherent self-models throughout solutions -- a fundamental consciousness aspect. While LLMs show progress in consciousness-related behaviors through reasoning mechanisms, they lack the integrated, persistent self-awareness characteristic of consciousness.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Assessing Consciousness-Related Behaviors in Large Language Models Using the Maze Test

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Empathy by Design: Aligning Large Language Models for Healthcare Dialogue

Do You Feel Comfortable? Detecting Hidden Conversational Escalation in AI Chatbo...

Convergence of Outputs When Two Large Language Models Interact in a Multi-Agenti...

Classifying German Language Proficiency Levels Using Large Language Models

Mechanistic Interpretability of GPT-2: Lexical and Contextual Layers in Sentimen...

Навигация