CogAtom: From Cognitive Atoms to Olympiad-level Mathematical Reasoning in Large Language Models

2509.17318v2 cs.AI, cs.CL, cs.LG 2025-09-25
Авторы:

Zhuofan Chen, Jiyuan He, Yichi Zhang, Xing Hu, Haoxing Wen, Jun Bai, Wenge Rong

Резюме на русском

## Контекст Математическое рассуждение является задачей, вызывающей значительные трудности для Больших Языковых Моделей (LLM), в силу необходимости многоэтапного мышления и интеграции абстрактных понятий. Несмотря на то, что тестовые техники, ориентированные на масштабирование во время тестирования, опираются на высококачественные, сложные задачи, недостаток уровня библиотек олимпиадных задач остается ограничительным фактором. Мы предлагаем CogAtom, новую модель, основанную на понятии «когнитивных атомов», для синтеза математически точных и когнитивно разнообразных задач. В отличие от предыдущих подходов, CogAtom рассматривает построение задач как процесс выбора и комбинирования основных способностей мышления, «когнитивных атомов», извлеченных из ручных решений. Алгоритм случайного блуждания, продвигающийся по сетке связности, позволяет экспериментировать с комбинациями этих атомов, чтобы достичь богатой структуры и логической звености в решениях. Это уникальный подход, обеспечивающий масштабируемость, качество и дизайн задач, соответствующий высокому уровню сложности. ## Метод CogAtom состоит из двух основных компонентов: синтеза когнитивных атомов и синтеза задач. Алгоритм извлечения когнитивных атомов отталкивается от решений, написанных людьми, и группирует шаги мышления в модули. Каждый модуль характеризуется индивидуальным набором признаков, описывающих его структуру и роль в решении задачи. Для синтеза задач используется метод случайного блуждания в сетке когнитивных атомов. Это позволяет создавать наборы решений, где каждое решение является уникальным и может отличаться по сложности и структуре. Для обеспечения логической целостности и грамматического достоверности задач используется система ограничений. Эта система гарантирует, что сгенерированная задача будет соответствовать реальным математическим нормам и требованиям. Таким образом, CogAtom реализует масштабируемую, диапазонно-контролируемую генерацию задач с высоким уровнем сложности и вариативности. ## Результаты Мы провести эксперименты, сравнивая CogAtom с другими подходами в области генерации задач математического рассуждения. Мы использовали данные, включающие олимпиадные задачи с разным уровнем сложности, от школьных задач до задач олимпиады. Результаты показали, что CogAtom показывает значительное превосходство в аккуратности, глубине рассуждения и разнообразии. Например, CogAtom способен генерировать задачи, которые значительно приближаются по сложности к задачам олимпиады AIME, но при этом демонстрирует более богатую с

Abstract

Mathematical reasoning poses significant challenges for Large Language Models (LLMs) due to its demand for multi-step reasoning and abstract conceptual integration. While recent test-time scaling techniques rely heavily on high-quality, challenging problems, the scarcity of Olympiad-level math problems remains a bottleneck. We introduce CogAtom, a novel cognitive atom-based framework for synthesizing mathematically rigorous and cognitively diverse problems. Unlike prior approaches, CogAtom models problem construction as a process of selecting and recombining fundamental reasoning units, cognitive atoms, extracted from human-authored solutions. A diversity-promoting random walk algorithm enables exploration of the cognitive atom space, while a constraint-based recombination mechanism ensures logical soundness and structural validity. The combinatorial nature of the graph structure provides a near-infinite space of reasoning paths, and the walk algorithm systematically explores this space to achieve large-scale synthesis of high-quality problems; meanwhile, by controlling the number of cognitive atoms, we can precisely adjust problem difficulty, ensuring diversity, scalability, and controllability of the generated problems. Experimental results demonstrate that CogAtom outperforms existing methods in accuracy, reasoning depth, and diversity, generating problems that closely match the difficulty of AIME while exceeding it in structural variation. Our work offers a cognitively grounded pathway toward scalable, high-quality math problem generation.Our code is publicly available at https://github.com/Icarus-1111/CogAtom.

Ссылки и действия