ATLANTIS: AI-driven Threat Localization, Analysis, and Triage Intelligence System

2509.14589v1 cs.CR, cs.AI 2025-09-20
Авторы:

Taesoo Kim, HyungSeok Han, Soyeon Park, Dae R. Jeong, Dohyeok Kim, Dongkwan Kim, Eunsoo Kim, Jiho Kim, Joshua Wang, Kangsu Kim, Sangwoo Ji, Woosun Song, Hanqing Zhao, Andrew Chin, Gyejin Lee, Kevin Stevens, Mansour Alharthi, Yizhuo Zhai, Cen Zhang, Joonun Jang, Yeongjin Jang, Ammar Askar, Dongju Kim, Fabian Fleischer, Jeongin Cho, Junsik Kim, Kyungjoon Ko, Insu Yun, Sangdon Park, Dowoo Baik, Haein Lee, Hyeon Heo, Minjae Gwon, Minjae Lee, Minwoo Baek, Seunggi Min, Wonyoung Kim, Yonghwi Jin, Younggi Park, Yunjae Choi, Jinho Jung, Gwanhyun Lee, Junyoung Jang, Kyuheon Kim, Yeonghyeon Cha, Youngjoon Kim

Резюме на русском

## Контекст Атаки в сфере кибербезопасности становятся все более сложными, что создает целый ряд проблем для широкого круга организаций. Они должны быстро обнаруживать и устранять уязвимости, но также обеспечивать корректность и эффективность используемых систем. Особенно трудно это становится при работе с разными языками программирования и большими кодовыми базами. Дарпа организовала AI Cyber Challenge (AIxCC), чтобы стимулировать развитие систем автоматизированного анализа и устранения уязвимостей. Этот конкурс стал мотивацией для создания ATLANTIS, системы, которая объединяет большие языковые модели (LLMs) с различными анализами программ, включая символьное исполнение, направленное фаззинг и статический анализ. ## Метод ATLANTIS разработана как комплексное решение, которое объединяет многоуровневый подход к анализу программ. Она использует: - **Большие языковые модели (LLMs)** для обработки текстовых запросов и понимания кода на разных уровнях. - **Символьное исполнение** для глубокого понимания выполнения программ и нахождения технических уязвимостей. - **Направленное фаззинг** для эффективного отыскания уязвимостей в разных частях кода. - **Статический анализ** для поиска потенциальных проблем независимо от исполнения. ATLANTIS также имплементирует систему для продуктивного устранения ошибок и создания правильных исправлений. Это решение позволяет быстро адаптироваться к различным типам кода, от C до Java, и обеспечена высокой точностью без потери широкого покрытия. ## Результаты В ходе исследований была проведена многоэтапная оценка ATLANTIS, включающая тестирование на различных кодовых базах. Она показала высокую точность в обнаружении уязвимостей и эффективность в их устранении. Набор данных, использованный в экспериментах, включал различные типы уязвимостей, что позволило проверить систему на реальных условиях. Результаты показали, что ATLANTIS выделяется своей скоростью и точностью, даже при работе с большими и сложными кодовыми базами. ## Значимость ATLANTIS может применяться в различных областях, где необходима быстрая и точная диагностика уязвимостей. Она имеет преимущества перед существующими системами, так как объединяет в себе несколько технологий, обеспечивая более высокую точность и покрытие. Это открывает широкие возможности для создания более безопасных систем, а также может способствовать развитию новых подходов в автоматическом программном исправлении. Также ATLANTIS может использоваться в отраслях, где требуется высокая эффективность анализа, таких как финансы, здравоохранение и ИТ-инфраструкту

Abstract

We present ATLANTIS, the cyber reasoning system developed by Team Atlanta that won 1st place in the Final Competition of DARPA's AI Cyber Challenge (AIxCC) at DEF CON 33 (August 2025). AIxCC (2023-2025) challenged teams to build autonomous cyber reasoning systems capable of discovering and patching vulnerabilities at the speed and scale of modern software. ATLANTIS integrates large language models (LLMs) with program analysis -- combining symbolic execution, directed fuzzing, and static analysis -- to address limitations in automated vulnerability discovery and program repair. Developed by researchers at Georgia Institute of Technology, Samsung Research, KAIST, and POSTECH, the system addresses core challenges: scaling across diverse codebases from C to Java, achieving high precision while maintaining broad coverage, and producing semantically correct patches that preserve intended behavior. We detail the design philosophy, architectural decisions, and implementation strategies behind ATLANTIS, share lessons learned from pushing the boundaries of automated security when program analysis meets modern AI, and release artifacts to support reproducibility and future research.

Ссылки и действия