AI-Augmented CI/CD Pipelines: From Code Commit to Production with Autonomous Decisions
2508.11867v1
cs.SE, cs.AI
2025-08-19
Авторы:
Mohammad Baqar, Saba Naqvi, Rajat Khanda
Резюме на русском
## Контекст
Modern software delivery стала системой, где развертывания происходят несколько раз в день, а не раз в квартал. Однако существуют еще многочисленные ручные решения, которые остаются главными источниками задержек и рабочей нагрузки. Это обусловлено тем, что люди должны решать проблемы, такие как интерпретация flaky tests, выбор стратегии rollback, настройка feature flags и определение момента для продвижения canary. Эти решения требуют много времени и сопровождаются риском ошибок. Мы предлагаем AI-Augmented CI/CD Pipelines, где бо LLM и автономные агенты работают в качестве policy-bounded co-pilots, сначала помогая людям, а позже принимая решения самостоятельно. Наше исследование направлено на глубокое понимание и улучшение CI/CD-процессов, используя искусственный интеллект для устранения этих проблем и оптимизации рабочего процесса.
## Метод
Мы предлагаем архитектуру, которая встраивает agentic decision points в CI/CD с помощью Больших Лингвистических Моделей (LLM) и автономных агентов. Эти агенты работают в составе системы, которая учитывает заранее определенные политики. Мы также предлагаем новую систему как код-за-политики, которая позволяет строить процессы решения в составе CI/CD. Была разработана многоуровневая система для стигматизации автономии, которая позволяет агентам постепенно принимать решения на разных этапах CI/CD. Мы использовали методы DevOps Research and Assessment (DORA) для оценки результатов и выделили индикаторы для эффективной оценки AI в CI/CD. Также, для проверки исследований, мы выполнили случайную моделирования индустрии, которая позволяла протестировать методы на реальных примерах.
## Результаты
Мы провели серию экспериментов, посвященных оценке системы AI-Augmented CI/CD Pipelines. Мы использовали реальные данные из DevOps-процессов и оценили эффективность автономных агентов по мерам DORA, таким как Time to Restore Service (MTTR) и Deployment Frequency. Мы также оценили использование feature flags, rollback стратегии и производительность canary-развертываний. Результаты показали, что AI-Augmented CI/CD Pipelines могут существенно уменьшить задержки и улучшить производительность, в то же время повышая доверие к автономным решениям.
## Значимость
Мы видим широкие области применения для AI-Augmented CI/CD Pipelines в производстве и сотрудничестве разработчиков. Это уменьшает время развертывания, улучшает качество кода, и увеличивает доверие в автономных решениях. Мощь этого подхода заключается в том, что он работает как граница между ручными решениями и автоматическими, то есть позволяет агентам принимать решения, когда это необходимо, а люди — только в случаях, когда это необходимо. Этот подход также может привести к более быстрому развитию систем, оптимизированным управлением решениями и уменьшению ошибок.
Abstract
Modern software delivery has accelerated from quarterly releases to multiple
deployments per day. While CI/CD tooling has matured, human decision points
interpreting flaky tests, choosing rollback strategies, tuning feature flags,
and deciding when to promote a canary remain major sources of latency and
operational toil. We propose AI-Augmented CI/CD Pipelines, where large language
models (LLMs) and autonomous agents act as policy-bounded co-pilots and
progressively as decision makers. We contribute: (1) a reference architecture
for embedding agentic decision points into CI/CD, (2) a decision taxonomy and
policy-as-code guardrail pattern, (3) a trust-tier framework for staged
autonomy, (4) an evaluation methodology using DevOps Research and Assessment (
DORA) metrics and AI-specific indicators, and (5) a detailed industrial-style
case study migrating a React 19 microservice to an AI-augmented pipeline. We
discuss ethics, verification, auditability, and threats to validity, and chart
a roadmap for verifiable autonomy in production delivery systems.
Ссылки и действия
Дополнительные ресурсы: