Large Language Models Show Signs of Alignment with Human Neurocognition During Abstract Reasoning

2508.10057v1 q-bio.NC, cs.AI, cs.CL 2025-08-15
Авторы:

Christopher Pinier, Sonia Acuña Vargas, Mariia Steeghs-Turchina, Dora Matzke, Claire E. Stevenson, Michael D. Nunez

Резюме на русском

## Контекст Абстрактный рассудок, характеризующийся возможностью описания и решением задач, не связанных с опытом, является ключевым признаком интеллектуальной активности. Этот процесс требует глубокой интеграции информации, синтеза новых представлений, понимания высшего порядка и прогнозирования результатов. Он присущ как человеческому мозгу, так и современным искусственным интеллектам. Однако существуют затруднения в измерении и сравнении этих процессов, особенно когда речь идет о сравнении архитектур нейронных сетей с биологическими сетями мозга. Данное исследование направлено на изучение степени аналогии между гомономной моделью человеческой нейрокогнитивной активности и текущими технологиями глубокого обучения. ## Метод Работа включала сравнительный анализ поведения людей и 8 моделей глубокого обучения с открытым исходным кодом на задаче абстрактного логического завершения. Метод основывался на сравнении типов задач и результатов, а также на измерении нейронных уровней активности с помощью электроэнцефалографии (EEG). Записи включали фиксационные потенциалы (Fixation-Related Potentials, FRPs), наблюдаемые во время выполнения задачи. Анализ проводился на основе данных взрослых участников, которые выполняли задачу в условиях электроэнцефалографического мониторинга. Исследование также использовало размерность и геометрию представлений внутри моделей, чтобы определить их соответствие людям. ## Результаты Сравнение показало, что только самые крупные модели, например Qwen-2.5-72B и DeepSeek-R1-70B, демонстрируют точность, аналогичную человеческой. Эти модели также создавали представления, которые отличались по степени группировки абстрактных категорий в слоях, соответствующих фазе решения задачи. Эти представления были близки по геометрии к нейронам человеческого мозга в лобной зоне, что свидетельствует о совместимости с биологическими процессами. Остальные модели и данные EEG не показали такой гармонии, становясь менее адекватными для сравнения. ## Значимость Найденные результаты указывают на возможность применения глубокого обучения для моделирования и понимания человеческого мозга в абстрактных задачах. Это открывает пути к новым подходам в робототехнике, синтетической когнитивной науке и теории обучения. Помимо этого, найденные аналогии могут способствовать развитию технологий понимания речи и синтеза смысла в автоматизированных системах. ## Выводы Данное исследование показало, что глубоко обученные модели могут демонстрировать поведение, похожее на человеческое в абстрактных

Abstract

This study investigates whether large language models (LLMs) mirror human neurocognition during abstract reasoning. We compared the performance and neural representations of human participants with those of eight open-source LLMs on an abstract-pattern-completion task. We leveraged pattern type differences in task performance and in fixation-related potentials (FRPs) as recorded by electroencephalography (EEG) during the task. Our findings indicate that only the largest tested LLMs (~70 billion parameters) achieve human-comparable accuracy, with Qwen-2.5-72B and DeepSeek-R1-70B also showing similarities with the human pattern-specific difficulty profile. Critically, every LLM tested forms representations that distinctly cluster the abstract pattern categories within their intermediate layers, although the strength of this clustering scales with their performance on the task. Moderate positive correlations were observed between the representational geometries of task-optimal LLM layers and human frontal FRPs. These results consistently diverged from comparisons with other EEG measures (response-locked ERPs and resting EEG), suggesting a potential shared representational space for abstract patterns. This indicates that LLMs might mirror human brain mechanisms in abstract reasoning, offering preliminary evidence of shared principles between biological and artificial intelligence.

Ссылки и действия

Связанные статьи

Beyond Individuals: Collective Predictive Coding for Memory, Attention, and the ...

#### Контекст Область исследования, сосредоточенная на понимании памяти, внимания и языка, широко распространена в научн...

2025-08-25