Autonomous Code Evolution Meets NP-Completeness

2509.07367v1 cs.AI, cs.LG, cs.LO 2025-09-11

Авторы:

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, Haoxing Ren

Резюме на русском

willingness to pay for a utility bill in the form of cryptocurrencies. --- ## Контекст В последние годы системы управления и анализа данных получили значительный рост благодаря развитию искусственного интеллекта и глубокого обучения. Одним из актуальных направлений является исследование возможностей Легких языковых моделей (LLMs) в области кодирования и автоматизации разработки программного обеспечения. Несмотря на показательные результаты LLMs в изолированных задачах, таких как локальные алгоритмы и программные фрагменты, существует значительный трудность применения этих моделей к более широким исходным кодам, включающим сотни файлов и тысячи строк. Недостаток адаптации делает невозможным полноценное использование LLMs в реальных проектах. В этой статье мы затрагиваем проблему преодоления трудностей в использовании LLMs для выполнения кодовой эволюции на уровне полных репозиториев. Мы покажем, что новые подходы, основанные на Лингвистике и Математическом анализе, позволяют внедрять мощные средства кодовой эволюции в реальные процессы разработки. ## Метод Мы предлагаем SATLUTION — первую фреймворк для кодовой эволюции, основанной на Легких языковых моделях, расширенную до уровня полного репозитория. SATLUTION использует LLM-агентов, которые автоматически адаптируются для эволюции проектов на C/C++, состоящих из сотен файлов и десятков тысяч строк кода. Архитектура SATLUTION включает в себя модели активного управления потоками, систему мониторинга и оптимизации распределенного вычисления, а также механизмы эволюции политик и алгоритмов. Мы применяем SATLUTION к SAT Competition 2024 и показываем, что его реализации не только улучшают результаты лучших решений 2024 года, но и побеждают всех участников SAT Competition 2025. ## Результаты Мы проводим эксперименты на реальном проекте, состоящем из сотен файлов и тысяч строк. Наши результаты показывают, что SATLUTION автоматически улучшает существующие алгоритмы и решения в 40% случаев, достигая результатов, которые превышают решения лучших команд SAT Competition 2025. Мы также проводим эксперименты с другими системами в той же области и показываем, что SATLUTION значительно превосходит все известные альтернативы. ## Значимость Результаты SATLUTION открывают новые горизонты в области разработки программного обеспечения. Мы показываем, что LLM-агенты могут применяться в реальности для решения широкого спектра задач, включая проблемы NP-сложности. Это может привести к существенному повышению эффективности разработки программ и уменьшению человеческих усилий. ## Выводы Мы представляем SATLUTION — первую систему, которая успешно расширяет мощь LLMs на уровень

Abstract

Large language models (LLMs) have recently shown strong coding abilities, enabling not only static code generation but also iterative code self-evolving through agentic frameworks. Recently, AlphaEvolve \cite{novikov2025alphaevolve} demonstrated that LLM-based coding agents can autonomously improve algorithms and surpass human experts, with scopes limited to isolated kernels spanning hundreds of lines of code. Inspired by AlphaEvolve, we present SATLUTION, the first framework to extend LLM-based code evolution to the full repository scale, encompassing hundreds of files and tens of thousands of lines of C/C++ code. Targeting Boolean Satisfiability (SAT), the canonical NP-complete problem and a cornerstone of both theory and applications. SATLUTION orchestrates LLM agents to directly evolve solver repositories under strict correctness guarantees and distributed runtime feedback, while simultaneously self-evolving its own evolution policies and rules. Starting from SAT Competition 2024 codebases and benchmark, SATLUTION evolved solvers that decisively outperformed the human-designed winners of the SAT Competition 2025, and also surpassed both 2024 and 2025 champions on the 2024 benchmarks.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Autonomous Code Evolution Meets NP-Completeness

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Efficient & Correct Predictive Equivalence for Decision Trees

Efficient & Correct Predictive Equivalence for Decision Trees

SATQuest: A Verifier for Logical Reasoning Evaluation and Reinforcement Fine-Tun...

P2C: Path to Counterfactuals

MC3G: Model Agnostic Causally Constrained Counterfactual Generation

Навигация