Reasoning Efficiently Through Adaptive Chain-of-Thought Compression: A Self-Optimizing Framework
2509.14093v1
cs.SE, cs.AI, cs.CL
2025-09-19
Авторы:
Kerui Huang, Shuhan Liu, Xing Hu, Tongtong Xu, Lingfeng Bao, Xin Xia
Резюме на русском
#### Контекст
Chain-of-Thought (CoT) reasoning является эффективным методом улучшения бо LLM, позволяющим ему выдавать промежуточные шаги в решении задач, что улучшает точность и устойчивость в таких областях, как ритеметрика, логика и прочие. Однако этот подход связан с высокими затратами ресурсов: длинные выводы увеличивают задержку, потребление памяти и требования к кэшу KV. Эти проблемы особенно актуальны в задачах, связанных со строительством программного обеспечения, где необходима компактность и определенность выводов. Несмотря на то, что CoT улучшает качество решений, полученные результаты показывают, что длинные выводы не всегда являются оптимальными. Это демонстрируется тем, что длинные выводы часто приводят к логическим ошибкам, обрыву вывода и повышенной задержке в вычислениях. В целом, эти наблюдения опровергают предположение о том, что длинное рассуждение всегда приносит пользу, и выделяют необходимость в развитии адаптивных методов контроля цепочки рассуждений.
#### Метод
Предлагается SEER (Self-Enhancing Efficient Reasoning), адаптивная система контроля CoT, которая уменьшает цену расчетов за счет сокращения длины выводов, при этом сохраняя их точность. Основные элементы SEER:
1. **Best-of-N Sampling**: Метод выбора лучших выводов, призванный повысить точность решений.
2. **Task-Aware Adaptive Filtering**: Фильтрация промежуточных результатов на основе предварительных выводов, чтобы уменьшить ненужную длину выводов и повысить их эффективность.
3. **Dynamic Thresholding**: Динамическая настройка порогов для фильтрации, чтобы адаптироваться к задаче и улучшить производительность.
SEER динамически анализирует выходные данные на этапе предварительного расчета, чтобы предотвратить проблемы, такие как неоптимальный выбор длины вывода, задержка и неточности.
#### Результаты
Исследования проводились на бенчмарках по генерации кода. Результаты показали, что SEER уменьшил длину вывода на 42.1%, что привело к снижению задержки и памяти, необходимой для вычислений. Было получено увеличение точности, так как SEER смог устранить многочисленные логические ошибки и неточности, которые возникали в длинных выводах. Кроме того, SEER удалил большую часть бесконечных циклов, которые часто порождались длинными цепочками рассуждений. В целом, эти результаты доказывают, что SEER эффективно сбалансированно уменьшает затраты на вычисления без ущерба для качества решений.
#### Значимость
Предлагаемый подход может быть применен в различных областях, где необходимо повысить производительность логических задач. Особенно актуально SEER для задач, связанных с системами программирования и логическими выводами. Его основные преимущества заключаются в том,
Abstract
Chain-of-Thought (CoT) reasoning enhances Large Language Models (LLMs) by
prompting intermediate steps, improving accuracy and robustness in arithmetic,
logic, and commonsense tasks. However, this benefit comes with high
computational costs: longer outputs increase latency, memory usage, and
KV-cache demands. These issues are especially critical in software engineering
tasks where concise and deterministic outputs are required. To investigate
these trade-offs, we conduct an empirical study based on code generation
benchmarks. The results reveal that longer CoT does not always help. Excessive
reasoning often causes truncation, accuracy drops, and latency up to five times
higher, with failed outputs consistently longer than successful ones. These
findings challenge the assumption that longer reasoning is inherently better
and highlight the need for adaptive CoT control. Motivated by this, we propose
SEER (Self-Enhancing Efficient Reasoning), an adaptive framework that
compresses CoT while preserving accuracy. SEER combines Best-of-N sampling with
task-aware adaptive filtering, dynamically adjusting thresholds based on
pre-inference outputs to reduce verbosity and computational overhead. We then
evaluate SEER on three software engineering tasks and one math task. On
average, SEER shortens CoT by 42.1%, improves accuracy by reducing truncation,
and eliminates most infinite loops. These results demonstrate SEER as a
practical method to make CoT-enhanced LLMs more efficient and robust, even
under resource constraints.
Ссылки и действия
Дополнительные ресурсы: