CogAtom: From Cognitive Atoms to Olympiad-level Mathematical Reasoning in Large Language Models

2509.17318v1 cs.AI, cs.CL, cs.LG 2025-09-24
Авторы:

Zhuofan Chen, Jiyuan He, Yichi Zhang, Xing Hu, Haoxing Wen, Jun Bai, Wenge Rong

Резюме на русском

## Контекст В настоящее время Математическое Разумение (MR) представляет собой сложную проблему для больших языковых моделей (LLMs), так как эта задача требует многоступенчатого мышления и интеграции абстрактных понятий. Несмотря на то, что методы тестового масштабирования в последнее время получили признание, они полагаются на высококачественные, но редкие задачи, в том числе и Олимпиадные задачи по математике. Однако доступ к таким задачам ограничен, что ограничивает широкое использование таких моделей в области генерации задач. Мы предлагаем CogAtom - рамфрмуру, основанную на когнитивных атомах, для создания сложных, но структурно разнообразных математических задач. Общая идея заключается в моделировании проблемной структуры как сборки из базовых примитивов мышления - когнитивных атомов, извлеченных из ручных решений. Это подход, отличающийся от использования простых операторов или готовых данных. ## Метод Имеющиеся методы генерации задач часто ограничены в своей пластичности и не могут генерировать задачи, которые достаточно сложны и жизненно важны для Олимпиадных задач. Мы предлагаем использовать когнитивный атом (CogAtom) - маленький блок, который может быть использован для построения новых задач. Наша модель работает в два этапа: (1) Извлечение нескольких моделей мышления из множества ручных решений к задачам, которые далее являются когнитивными атомами; (2) Создание новых задач с помощью графа, состоящего из этих когнитивных атомов. Для построения проблемных структур мы используем случайный процесс типа случайного пути, который позволяет избегать локальных минимумов при построении проблем, при этом метод рекомбинации гарантирует логическую целостность и структурную целостность. Наконец, добавление дополнительных когнитивных атомов может увеличить сложность задачи, при этом позволяя управлять её сложностью. ## Результаты Мы провели эксперименты на множестве различных задач, включая задачи Олимпиады по математике, чтобы оценить способность CogAtom генерировать задачи. Мы сравнили нашу модель с другими подходами, использующими техники тестового масштабирования. Результаты показали, что модель CogAtom не только превосходит существующие методы по метрикам точности и глубины мышления, но и позволяет получить более разнообразные задачи. Например, CogAtom удалось сгенерировать задачи с уровнем сложности, совпадающим с задачами AIME, и в то же время добиться большей структурной разнообразности. Эти результаты подтверждают то, что CogAtom может стать мощным инструментом для генерации уровня задач, который близок к Олимпиадам.

Abstract

Mathematical reasoning poses significant challenges for Large Language Models (LLMs) due to its demand for multi-step reasoning and abstract conceptual integration. While recent test-time scaling techniques rely heavily on high-quality, challenging problems, the scarcity of Olympiad-level math problems remains a bottleneck. We introduce CogAtom, a novel cognitive atom-based framework for synthesizing mathematically rigorous and cognitively diverse problems. Unlike prior approaches, CogAtom models problem construction as a process of selecting and recombining fundamental reasoning units, cognitive atoms, extracted from human-authored solutions. A diversity-promoting random walk algorithm enables exploration of the cognitive atom space, while a constraint-based recombination mechanism ensures logical soundness and structural validity. The combinatorial nature of the graph structure provides a near-infinite space of reasoning paths, and the walk algorithm systematically explores this space to achieve large-scale synthesis of high-quality problems; meanwhile, by controlling the number of cognitive atoms, we can precisely adjust problem difficulty, ensuring diversity, scalability, and controllability of the generated problems. Experimental results demonstrate that CogAtom outperforms existing methods in accuracy, reasoning depth, and diversity, generating problems that closely match the difficulty of AIME while exceeding it in structural variation. Our work offers a cognitively grounded pathway toward scalable, high-quality math problem generation.Our code is publicly available at https://github.com/Icarus-1111/CogAtom.

Ссылки и действия