AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning

2508.20866v1 cs.CR, cs.AI 2025-08-30
Авторы:

Amine Lbath, Massih-Reza Amini, Aurelien Delaitre, Vadim Okun

Резюме на русском

Огромный рост сложности программных систем и угроз в виде кибер-атак привели к необходимости эффективных методов автоматизированного обнаружения и устранения уязвимостей. Традиционные подходы, такие как статический анализ кода, сталкиваются с проблемами скалируемости, адаптивности и высокими ценами на ошибки. Авторы предлагают новую рамку для автоматического введения реалистичных уязвимостей в код C/C++, используя мульти-агентные системы с использованием технологии Retrieval-Augmented Generation и оптимизированных методов гармонизации весов модели. Это позволяет эффективно внедрять уязвимости и создавать высококачественные данные для обучения моделей. Исследование показало, что новый подход достигает успешности внедрения уязвимостей на уровне функций от 89% до 95%, превышая другие методы. Это демонстрирует перспективу AI в автоматизации процессов обнаружения и моделирования уязвимостей.

Abstract

The increasing complexity of software systems and the sophistication of cyber-attacks have underscored the critical need for effective automated vulnerability detection and repair systems. Traditional methods, such as static program analysis, face significant challenges related to scalability, adaptability, and high false-positive and false-negative rates. AI-driven approaches, particularly those using machine learning and deep learning models, show promise but are heavily reliant on the quality and quantity of training data. This paper introduces a novel framework designed to automatically introduce realistic, category-specific vulnerabilities into secure C/C++ codebases to generate datasets. The proposed approach coordinates multiple AI agents that simulate expert reasoning, along with function agents and traditional code analysis tools. It leverages Retrieval-Augmented Generation for contextual grounding and employs Low-Rank approximation of weights for efficient model fine-tuning. Our experimental study on 116 code samples from three different benchmarks suggests that our approach outperforms other techniques with regard to dataset accuracy, achieving between 89\% and 95\% success rates in injecting vulnerabilities at function level.

Ссылки и действия