KG-Augmented Executable CoT for Mathematical Coding

2508.04072v1 cs.AI 2025-08-09
Авторы:

Xingyu Chen, Junxiu An, Jun Guo, Li Wang, Jingcai Guo

Резюме на русском

```markdown ## КОНТЕКСТ И ПРОБЛЕМАТИКА В последние годы большие языковые модели (Large Language Models, LLMs) достигли значительных успехов в области обработки естественного языка, но в то же время сталкиваются с существенными трудностями при решении сложных задач, требующих высокого уровня логического и математического рассуждения, а также генерации кода. Одной из ключевых проблем является недостаточная точность и надежность моделей при работе с математическими задачами, особенно когда речь идет о генерации кода, который должен не только быть правильным синтаксически, но и проходить проверку на выполнение. Традиционные методы промптинга (prompting) часто не могут обеспечень высокий уровень точности, особенно при работе с задачами, требующими глубокого понимания математических концепций и библиотек. Другой проблемой является неэффективность в использовании внешних источников знаний, таких как математические библиотеки, что может приводить к неточностям в генерации кода или неудачному применению методов. Без какой-либо структурированной поддержки, модели часто не могут эффективно использовать сложные математические знания, что ограничивает их применимость в реальных задачах. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения вышеупомянутых проблем, авторы предлагают новый фреймворк под названием KG-Augmented Executable Chain-of-Thought (KGA-ECoT). Этот фреймворк основывается на концепции Chain-of-Thought (CoT), но расширяет его за счет использования знаний, представленных в виде графов знаний (Knowledge Graphs). KGA-ECoT разбивает сложные математические задачи на структурированные графы задач (Structured Task Graph), что позволяет более эффективно извлекать и использовать знания из внешних источников, таких как математические библиотеки. Одним из ключевых компонентов KGA-ECoT является GraphRAG (Graph-based Retrieval-Augmented Generation), который обеспечивает более точное извлечение знаний из математических библиотек. Этот метод позволяет модели не только получать нужную информацию, но и использовать ее для генерации высококачественного кода. Кроме того, KGA-ECoT использует "executable code", то есть код, который может быть выполнен и проверен на точность. Это гарантирует, что генерируемый код будет не только правильным с точки зрения синтаксиса, но и действительно работоспособным. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности KGA-ECoT, авторы провели ряд экспериментов на различных математических резонирования бенчмарках. Результаты показали, что KGA-ECoT значительно превосходит существующие методы промптинга, достигая повышения точности от нескольких до десятков процентных пунктов. Эти улучшения были достигнуты благодаря использованию GraphRAG для точного извлечения знаний и выполнения кода, который гарантировал высокую точность вычислений. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ KGA-ECoT имеет широкое применение в областях, требующих высокой точности в математическом резонировании и генерации кода. Например, он может быть использован в областях таких как финансовые моделирования, инженерные расчеты, научные исследования, где точность и надежность кода критически важны. Благодаря своей способности эффективно использовать внешние библиотеки и гарантировать высокую точность, KGA-ECoT может стать важной частью разработки программного обеспечения и автоматизации математических задач. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В заключение, KGA-ECoT представляет собой мощный и гибкий фреймворк для решения сложных математических задач, который сочетает в себе эффективное использование графов знаний и выполняемого кода. Будущие исследования могут фокусироваться на дальнейшем улучшении точности и эффективности этого подхода, а также на его применении в других областях, требующих сложного рассуждения и генерации кода. ```

Abstract

In recent years, large language models (LLMs) have excelled in natural language processing tasks but face significant challenges in complex reasoning tasks such as mathematical reasoning and code generation. To address these limitations, we propose KG-Augmented Executable Chain-of-Thought (KGA-ECoT), a novel framework that enhances code generation through knowledge graphs and improves mathematical reasoning via executable code. KGA-ECoT decomposes problems into a Structured Task Graph, leverages efficient GraphRAG for precise knowledge retrieval from mathematical libraries, and generates verifiable code to ensure computational accuracy. Evaluations on multiple mathematical reasoning benchmarks demonstrate that KGA-ECoT significantly outperforms existing prompting methods, achieving absolute accuracy improvements ranging from several to over ten percentage points. Further analysis confirms the critical roles of GraphRAG in enhancing code quality and external code execution in ensuring precision. These findings collectively establish KGA-ECoT as a robust and highly generalizable framework for complex mathematical reasoning tasks.

Ссылки и действия