Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld's Episode Theory

2509.14662v1 cs.AI, cs.CL, cs.LG 2025-09-20

Авторы:

Ming Li, Nan Zhang, Chenrui Fan, Hong Jiao, Yanbin Fu, Sydney Peters, Qingshu Xu, Robert Lissitz, Tianyi Zhou

Резюме на русском

## Контекст Статья рассматривает проблему понимания мышления у алгоритмов с цепочкой мыслей (chain-of-thought reasoning), которые используются в машинном обучении, особенно в задачах математического моделирования. Несмотря на то, что такие модели могут генерировать достаточно детальные цепочки рассуждений, эксперты исследователей не имеют четкой системы для анализа этих процессов. Одной из мотиваций является необходимость создания более прозрачных и управляемых моделей, которые могут объяснить свои решения. Такое понимание не только улучшит надежность моделей, но и позволит их лучше применять в реальной жизни, где понятность решений критична. Одной из самых популярных моделей является Large Reasoning Model (LRM), которая способна разбирать задачи сложного уровня. Однако, нет единого фреймворка для анализа работы таких моделей. Идея статьи заключается в использовании теории Схёнфельда о событиях (Episode Theory), которая была разработана для изучения устройства человеческого мышления в математике, для анализа цепочек мыслей моделей. Этот подход позволяет проанализировать, как LRMs принимают решения, какие этапы они проходят и что это говорит о динамике их работы. ## Метод Авторы применяют теорию Схёнфельда о событиях (Episode Theory) для разбора процесса рассуждений LRMs. Эта теория разделяет процесс решения задач на несколько определенных этапов (называемых "событиями"), таких как планирование, выполнение, проверка и другие. Для этого была проведена интенсивная работа по лексикографическому анализу и аннотации данных. Было проанализировано многочисленное количество решений, сгенерированных моделью LRM, и по каждому решению были применены семь этих "событий" для описания того, как модель пришла к решению. Из этой работы появился большой корпус данных, полностью аннотированный, который является первым в своем роде для цельного анализа машинного мышления. Авторы также разработали подробное руководство по аннотации, чтобы обеспечить точность и согласованность в анализе. Этот подход позволил исследователям выявить различные динамические закономерности в поведении моделей, включая переходы между состояниями рассуждений. ## Результаты В результате применения теории Схёнфельда к LRMs было выявлено несколько главных тенденций: 1. Модели LRMs используют схожие стратегии решения задач, что дает представление о том, как они приходят к решению. 2. Было выявлено, что LRMs часто переходят между разными состояниями рассуждений, такими как "планирование" и "проверка". 3. Было показано, что шаги, которые делают модели, могут быть структурированы и анализированы с помощью метода Episode Theory. Таким образом, авторы подгото

Abstract

While Large Reasoning Models (LRMs) generate extensive chain-of-thought reasoning, we lack a principled framework for understanding how these thoughts are structured. In this paper, we introduce a novel approach by applying Schoenfeld's Episode Theory, a classic cognitive framework for human mathematical problem-solving, to analyze the reasoning traces of LRMs. We annotated thousands of sentences and paragraphs from model-generated solutions to math problems using seven cognitive labels (e.g., Plan, Implement, Verify). The result is the first publicly available benchmark for the fine-grained analysis of machine reasoning, including a large annotated corpus and detailed annotation guidebooks. Our preliminary analysis reveals distinct patterns in LRM reasoning, such as the transition dynamics between cognitive states. This framework provides a theoretically grounded methodology for interpreting LRM cognition and enables future work on more controllable and transparent reasoning systems.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld's Episode Theory

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

STELLA: Guiding Large Language Models for Time Series Forecasting with Semantic ...

LEC: Linear Expectation Constraints for False-Discovery Control in Selective Pre...

Guided Self-Evolving LLMs with Minimal Human Supervision

Martingale Score: An Unsupervised Metric for Bayesian Rationality in LLM Reasoni...

ORION: Teaching Language Models to Reason Efficiently in the Language of Thought

Навигация