AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning
2508.20866v1
cs.CR, cs.AI
2025-08-30
Авторы:
Amine Lbath, Massih-Reza Amini, Aurelien Delaitre, Vadim Okun
Резюме на русском
Огромный рост сложности программных систем и угроз в виде кибер-атак привели к необходимости эффективных методов автоматизированного обнаружения и устранения уязвимостей. Традиционные подходы, такие как статический анализ кода, сталкиваются с проблемами скалируемости, адаптивности и высокими ценами на ошибки. Авторы предлагают новую рамку для автоматического введения реалистичных уязвимостей в код C/C++, используя мульти-агентные системы с использованием технологии Retrieval-Augmented Generation и оптимизированных методов гармонизации весов модели. Это позволяет эффективно внедрять уязвимости и создавать высококачественные данные для обучения моделей. Исследование показало, что новый подход достигает успешности внедрения уязвимостей на уровне функций от 89% до 95%, превышая другие методы. Это демонстрирует перспективу AI в автоматизации процессов обнаружения и моделирования уязвимостей.
Abstract
The increasing complexity of software systems and the sophistication of
cyber-attacks have underscored the critical need for effective automated
vulnerability detection and repair systems. Traditional methods, such as static
program analysis, face significant challenges related to scalability,
adaptability, and high false-positive and false-negative rates. AI-driven
approaches, particularly those using machine learning and deep learning models,
show promise but are heavily reliant on the quality and quantity of training
data. This paper introduces a novel framework designed to automatically
introduce realistic, category-specific vulnerabilities into secure C/C++
codebases to generate datasets. The proposed approach coordinates multiple AI
agents that simulate expert reasoning, along with function agents and
traditional code analysis tools. It leverages Retrieval-Augmented Generation
for contextual grounding and employs Low-Rank approximation of weights for
efficient model fine-tuning. Our experimental study on 116 code samples from
three different benchmarks suggests that our approach outperforms other
techniques with regard to dataset accuracy, achieving between 89\% and 95\%
success rates in injecting vulnerabilities at function level.
Ссылки и действия
Дополнительные ресурсы: