CAC-CoT: Connector-Aware Compact Chain-of-Thought for Efficient Reasoning Data Synthesis Across Dual-System Cognitive Tasks

2508.18743v1 cs.AI, cs.CL 2025-08-28

Авторы:

Sunguk Choi, Yonghoon Kwon, Heondeuk Lee

Резюме на русском

## Контекст Проблематика обучения Large Language Models (LLMs) в области создания структурированных цепочек мыслей (Chain-of-Thought, CoT) для решения сложных задач является текущим объектом интереса в машинном обучении. Несмотря на то, что CoT-prompting позволяет LLMs решать сложные проблемы, очень длинные цепочки мыслей часто приводят к замедлению процесса рассуждения и даже к ухудшению качества решения задач, особенно в случае быстрых, интуитивных "System-1" задач. Одной из основных мотиваций является создание более эффективных техник CoT-prompting, которые бы стабильно обеспечивали высокое качество решения задач, сочетая сокращенные и структурированные цепочки мыслей с быстротой и эффективностью. ## Метод Метод CAC-CoT (Connector-Aware Compact Chain-of-Thought) предлагает сократить цепочки мыслей, используя фиксированный набор коннекторов (connector phrases). Эти коннекторы руководят моделью к созданию компактных и структурированных рассуждений, уменьшая длину цепочки мыслей без потери точности. Метод основывается на модели Gemini-2.0-Flash, которая строит компактные цепочки мыслей с помощью ограниченного набора коннекторов. Это позволяет модели лучше сфокусироваться на целевой задаче, уменьшая раздутые цепочки мыслей. ## Результаты Эксперименты проводились на двух типах задач: System-2 (GSM8K и GPQA) и System-1 (S1-Bench). Результаты показали, что CAC-CoT достигает примерно 85% точности на GSM8K и примерно 40% на GPQA, не ухудшаясь на GSM8K. Для S1-Bench, CAC-CoT сохраняет примерно 90% точности, что указывает на сбалансированность между System-1 и System-2 задачами. Одним из ключевых результатов является сокращение длины цепочек мыслей до примерно 300 токенов (ART), что составляет примерно одну треть длины цепочек базовых моделей, не приводя к ухудшению точности. ## Значимость CAC-CoT трансформирует технологию CoT-prompting, предлагая эффективный подход для создания структурированных цепочек мыслей, который может использоваться в области решения сложных задач. Он показывает сильные преимущества в системах, требующих быстрого вывода без потери точности. Инновационность CAC-CoT заключается в его удобстве для применения в реальном мире, где требуется компактность и эффективность. Это может иметь значительное влияние на применение LLMs в сферах, где необходима быстрая интуитивная обработка данных. ## Выводы CAC-CoT достигает баланса между эффективностью и точностью, позволяя LLMs быстро решать быстрые задачи, не ухудшаясь на сложных задачах. Будущие исследования могут сосредоточиться на улучшении коннекторов, исследовании других моделей

Abstract

Long chain-of-thought (CoT) prompting helps Large Language Models (LLMs) solve difficult problems, but very long traces often slow or even degrade performance on fast, intuitive "System-1" tasks. We introduce Connector-Aware Compact CoT (CAC-CoT) -- a method that deliberately restricts reasoning to a small, fixed set of connector phrases, steering the model toward concise and well -- structured explanations. Despite its simplicity, our synthetic method with Gemini-2.0-Flash yields a high-quality training quality. CAC-CoT achieves approximately 85% on GSM8K and approximately 40% on GPQA (System-2) while retaining approximately 90% on S1-Bench (System-1). Its reasoning traces average approximately 300 tokens(ART), about one-third the length of baseline traces, delivering higher efficiency without loss of accuracy.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

CAC-CoT: Connector-Aware Compact Chain-of-Thought for Efficient Reasoning Data Synthesis Across Dual-System Cognitive Tasks

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Algorithmic Thinking Theory

From Atomic to Composite: Reinforcement Learning Enables Generalization in Compl...

LLM CHESS: Benchmarking Reasoning and Instruction-Following in LLMs through Ches...

DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning

Probing the "Psyche'' of Large Reasoning Models: Understanding Through a Human L...

Навигация