Large Language Models Show Signs of Alignment with Human Neurocognition During Abstract Reasoning
2508.10057v1
q-bio.NC, cs.AI, cs.CL
2025-08-15
Авторы:
Christopher Pinier, Sonia Acuña Vargas, Mariia Steeghs-Turchina, Dora Matzke, Claire E. Stevenson, Michael D. Nunez
Резюме на русском
## Контекст
Абстрактный рассудок, характеризующийся возможностью описания и решением задач, не связанных с опытом, является ключевым признаком интеллектуальной активности. Этот процесс требует глубокой интеграции информации, синтеза новых представлений, понимания высшего порядка и прогнозирования результатов. Он присущ как человеческому мозгу, так и современным искусственным интеллектам. Однако существуют затруднения в измерении и сравнении этих процессов, особенно когда речь идет о сравнении архитектур нейронных сетей с биологическими сетями мозга. Данное исследование направлено на изучение степени аналогии между гомономной моделью человеческой нейрокогнитивной активности и текущими технологиями глубокого обучения.
## Метод
Работа включала сравнительный анализ поведения людей и 8 моделей глубокого обучения с открытым исходным кодом на задаче абстрактного логического завершения. Метод основывался на сравнении типов задач и результатов, а также на измерении нейронных уровней активности с помощью электроэнцефалографии (EEG). Записи включали фиксационные потенциалы (Fixation-Related Potentials, FRPs), наблюдаемые во время выполнения задачи. Анализ проводился на основе данных взрослых участников, которые выполняли задачу в условиях электроэнцефалографического мониторинга. Исследование также использовало размерность и геометрию представлений внутри моделей, чтобы определить их соответствие людям.
## Результаты
Сравнение показало, что только самые крупные модели, например Qwen-2.5-72B и DeepSeek-R1-70B, демонстрируют точность, аналогичную человеческой. Эти модели также создавали представления, которые отличались по степени группировки абстрактных категорий в слоях, соответствующих фазе решения задачи. Эти представления были близки по геометрии к нейронам человеческого мозга в лобной зоне, что свидетельствует о совместимости с биологическими процессами. Остальные модели и данные EEG не показали такой гармонии, становясь менее адекватными для сравнения.
## Значимость
Найденные результаты указывают на возможность применения глубокого обучения для моделирования и понимания человеческого мозга в абстрактных задачах. Это открывает пути к новым подходам в робототехнике, синтетической когнитивной науке и теории обучения. Помимо этого, найденные аналогии могут способствовать развитию технологий понимания речи и синтеза смысла в автоматизированных системах.
## Выводы
Данное исследование показало, что глубоко обученные модели могут демонстрировать поведение, похожее на человеческое в абстрактных
Abstract
This study investigates whether large language models (LLMs) mirror human
neurocognition during abstract reasoning. We compared the performance and
neural representations of human participants with those of eight open-source
LLMs on an abstract-pattern-completion task. We leveraged pattern type
differences in task performance and in fixation-related potentials (FRPs) as
recorded by electroencephalography (EEG) during the task. Our findings indicate
that only the largest tested LLMs (~70 billion parameters) achieve
human-comparable accuracy, with Qwen-2.5-72B and DeepSeek-R1-70B also showing
similarities with the human pattern-specific difficulty profile. Critically,
every LLM tested forms representations that distinctly cluster the abstract
pattern categories within their intermediate layers, although the strength of
this clustering scales with their performance on the task. Moderate positive
correlations were observed between the representational geometries of
task-optimal LLM layers and human frontal FRPs. These results consistently
diverged from comparisons with other EEG measures (response-locked ERPs and
resting EEG), suggesting a potential shared representational space for abstract
patterns. This indicates that LLMs might mirror human brain mechanisms in
abstract reasoning, offering preliminary evidence of shared principles between
biological and artificial intelligence.
Ссылки и действия
Дополнительные ресурсы: