AI-Augmented CI/CD Pipelines: From Code Commit to Production with Autonomous Decisions

2508.11867v1 cs.SE, cs.AI 2025-08-19
Авторы:

Mohammad Baqar, Saba Naqvi, Rajat Khanda

Резюме на русском

## Контекст Modern software delivery стала системой, где развертывания происходят несколько раз в день, а не раз в квартал. Однако существуют еще многочисленные ручные решения, которые остаются главными источниками задержек и рабочей нагрузки. Это обусловлено тем, что люди должны решать проблемы, такие как интерпретация flaky tests, выбор стратегии rollback, настройка feature flags и определение момента для продвижения canary. Эти решения требуют много времени и сопровождаются риском ошибок. Мы предлагаем AI-Augmented CI/CD Pipelines, где бо LLM и автономные агенты работают в качестве policy-bounded co-pilots, сначала помогая людям, а позже принимая решения самостоятельно. Наше исследование направлено на глубокое понимание и улучшение CI/CD-процессов, используя искусственный интеллект для устранения этих проблем и оптимизации рабочего процесса. ## Метод Мы предлагаем архитектуру, которая встраивает agentic decision points в CI/CD с помощью Больших Лингвистических Моделей (LLM) и автономных агентов. Эти агенты работают в составе системы, которая учитывает заранее определенные политики. Мы также предлагаем новую систему как код-за-политики, которая позволяет строить процессы решения в составе CI/CD. Была разработана многоуровневая система для стигматизации автономии, которая позволяет агентам постепенно принимать решения на разных этапах CI/CD. Мы использовали методы DevOps Research and Assessment (DORA) для оценки результатов и выделили индикаторы для эффективной оценки AI в CI/CD. Также, для проверки исследований, мы выполнили случайную моделирования индустрии, которая позволяла протестировать методы на реальных примерах. ## Результаты Мы провели серию экспериментов, посвященных оценке системы AI-Augmented CI/CD Pipelines. Мы использовали реальные данные из DevOps-процессов и оценили эффективность автономных агентов по мерам DORA, таким как Time to Restore Service (MTTR) и Deployment Frequency. Мы также оценили использование feature flags, rollback стратегии и производительность canary-развертываний. Результаты показали, что AI-Augmented CI/CD Pipelines могут существенно уменьшить задержки и улучшить производительность, в то же время повышая доверие к автономным решениям. ## Значимость Мы видим широкие области применения для AI-Augmented CI/CD Pipelines в производстве и сотрудничестве разработчиков. Это уменьшает время развертывания, улучшает качество кода, и увеличивает доверие в автономных решениях. Мощь этого подхода заключается в том, что он работает как граница между ручными решениями и автоматическими, то есть позволяет агентам принимать решения, когда это необходимо, а люди — только в случаях, когда это необходимо. Этот подход также может привести к более быстрому развитию систем, оптимизированным управлением решениями и уменьшению ошибок.

Abstract

Modern software delivery has accelerated from quarterly releases to multiple deployments per day. While CI/CD tooling has matured, human decision points interpreting flaky tests, choosing rollback strategies, tuning feature flags, and deciding when to promote a canary remain major sources of latency and operational toil. We propose AI-Augmented CI/CD Pipelines, where large language models (LLMs) and autonomous agents act as policy-bounded co-pilots and progressively as decision makers. We contribute: (1) a reference architecture for embedding agentic decision points into CI/CD, (2) a decision taxonomy and policy-as-code guardrail pattern, (3) a trust-tier framework for staged autonomy, (4) an evaluation methodology using DevOps Research and Assessment ( DORA) metrics and AI-specific indicators, and (5) a detailed industrial-style case study migrating a React 19 microservice to an AI-augmented pipeline. We discuss ethics, verification, auditability, and threats to validity, and chart a roadmap for verifiable autonomy in production delivery systems.

Ссылки и действия