ATLANTIS: AI-driven Threat Localization, Analysis, and Triage Intelligence System
2509.14589v1
cs.CR, cs.AI
2025-09-20
Авторы:
Taesoo Kim, HyungSeok Han, Soyeon Park, Dae R. Jeong, Dohyeok Kim, Dongkwan Kim, Eunsoo Kim, Jiho Kim, Joshua Wang, Kangsu Kim, Sangwoo Ji, Woosun Song, Hanqing Zhao, Andrew Chin, Gyejin Lee, Kevin Stevens, Mansour Alharthi, Yizhuo Zhai, Cen Zhang, Joonun Jang, Yeongjin Jang, Ammar Askar, Dongju Kim, Fabian Fleischer, Jeongin Cho, Junsik Kim, Kyungjoon Ko, Insu Yun, Sangdon Park, Dowoo Baik, Haein Lee, Hyeon Heo, Minjae Gwon, Minjae Lee, Minwoo Baek, Seunggi Min, Wonyoung Kim, Yonghwi Jin, Younggi Park, Yunjae Choi, Jinho Jung, Gwanhyun Lee, Junyoung Jang, Kyuheon Kim, Yeonghyeon Cha, Youngjoon Kim
Резюме на русском
## Контекст
Атаки в сфере кибербезопасности становятся все более сложными, что создает целый ряд проблем для широкого круга организаций. Они должны быстро обнаруживать и устранять уязвимости, но также обеспечивать корректность и эффективность используемых систем. Особенно трудно это становится при работе с разными языками программирования и большими кодовыми базами. Дарпа организовала AI Cyber Challenge (AIxCC), чтобы стимулировать развитие систем автоматизированного анализа и устранения уязвимостей. Этот конкурс стал мотивацией для создания ATLANTIS, системы, которая объединяет большие языковые модели (LLMs) с различными анализами программ, включая символьное исполнение, направленное фаззинг и статический анализ.
## Метод
ATLANTIS разработана как комплексное решение, которое объединяет многоуровневый подход к анализу программ. Она использует:
- **Большие языковые модели (LLMs)** для обработки текстовых запросов и понимания кода на разных уровнях.
- **Символьное исполнение** для глубокого понимания выполнения программ и нахождения технических уязвимостей.
- **Направленное фаззинг** для эффективного отыскания уязвимостей в разных частях кода.
- **Статический анализ** для поиска потенциальных проблем независимо от исполнения.
ATLANTIS также имплементирует систему для продуктивного устранения ошибок и создания правильных исправлений. Это решение позволяет быстро адаптироваться к различным типам кода, от C до Java, и обеспечена высокой точностью без потери широкого покрытия.
## Результаты
В ходе исследований была проведена многоэтапная оценка ATLANTIS, включающая тестирование на различных кодовых базах. Она показала высокую точность в обнаружении уязвимостей и эффективность в их устранении. Набор данных, использованный в экспериментах, включал различные типы уязвимостей, что позволило проверить систему на реальных условиях. Результаты показали, что ATLANTIS выделяется своей скоростью и точностью, даже при работе с большими и сложными кодовыми базами.
## Значимость
ATLANTIS может применяться в различных областях, где необходима быстрая и точная диагностика уязвимостей. Она имеет преимущества перед существующими системами, так как объединяет в себе несколько технологий, обеспечивая более высокую точность и покрытие. Это открывает широкие возможности для создания более безопасных систем, а также может способствовать развитию новых подходов в автоматическом программном исправлении. Также ATLANTIS может использоваться в отраслях, где требуется высокая эффективность анализа, таких как финансы, здравоохранение и ИТ-инфраструкту
Abstract
We present ATLANTIS, the cyber reasoning system developed by Team Atlanta
that won 1st place in the Final Competition of DARPA's AI Cyber Challenge
(AIxCC) at DEF CON 33 (August 2025). AIxCC (2023-2025) challenged teams to
build autonomous cyber reasoning systems capable of discovering and patching
vulnerabilities at the speed and scale of modern software. ATLANTIS integrates
large language models (LLMs) with program analysis -- combining symbolic
execution, directed fuzzing, and static analysis -- to address limitations in
automated vulnerability discovery and program repair. Developed by researchers
at Georgia Institute of Technology, Samsung Research, KAIST, and POSTECH, the
system addresses core challenges: scaling across diverse codebases from C to
Java, achieving high precision while maintaining broad coverage, and producing
semantically correct patches that preserve intended behavior. We detail the
design philosophy, architectural decisions, and implementation strategies
behind ATLANTIS, share lessons learned from pushing the boundaries of automated
security when program analysis meets modern AI, and release artifacts to
support reproducibility and future research.
Ссылки и действия
Дополнительные ресурсы: