MultiFuzz: A Dense Retrieval-based Multi-Agent System for Network Protocol Fuzzing

2508.14300v1 cs.CR, cs.CL, cs.MA, cs.NI 2025-08-22
Авторы:

Youssef Maklad, Fares Wael, Ali Hamdi, Wael Elsersy, Khaled Shaban

Резюме на русском

Да, вот резюме научной статьи в указанной структуре: ## Контекст Протокол fuzzing — это процесс, направленный на выявление уязвимостей в сетевых протоколах путем создания и отправки специально сконструированных некорректных сообщений. Однако традиционные методы, такие как AFL-based системы, не всегда эффективны из-за ограниченного понимания семантики сложных грамматик протоколов и строгой стратегии мутации семента. Недавние работы, такие как ChatAFL, включают Large Language Models (LLMs) для улучшения эффективности fuzzing, но столкнулись с проблемами, такими как нестабильность вывода, синтетические ошибки, а также предположение, что LLM имеет знания о спецификациях протоколов. Эти ограничения могут привести к недоступности глубинных состояний протокола и ограниченной обнаруживаемости уязвимостей. Таким образом, требуется новая подходящая архитектура, которая улучшит семантическое понимание, увеличит соответствие синтаксическим ограничениям и увеличит глубину тестирования протоколов. ## Метод MultiFuzz — это новая система, основанная на dense retrieval, которая использует тонкие агенты (multi-agent system) для протокола fuzzing. Она интегрирует знания из документации RFC с помощью dense retrieval и векторной базы данных. Это позволяет MultiFuzz генерировать более структурированные и надежные выходы с помощью RAG (retrieval-augmented generation) pipeline. Агенты в MultiFuzz работают как специализированные модули, которые сотрудничают через chain-of-thought (CoT) reasoning. Это позволяет динамически адаптировать стратегии fuzzing на основе полученного контекста. Таким образом, MultiFuzz предлагает усовершенствованный подход к fuzzing, используя семантическое понимание, структурированное управление и эффективное использование LLMs для достижения более глубокого и надежного тестирования протоколов. ## Результаты Эксперименты проводились на Real-Time Streaming Protocol (RTSP), где MultiFuzz был сравнен с тремя современными SOTA протокольными fuzzers: NSFuzz, AFLNet и ChatAFL. MultiFuzz показал значительное улучшение в глубине и широте исследования состояний протокола, включая более высокий branch coverage и полноту покрытия протокола. Это достигнуто благодаря точному пониманию семантики RFC-документов, гибкой стратегии мутации и использованию LLM-based reasoning для развития более глубоких и структурированных тестовых сообщений. Эти результаты демонстрируют, что MultiFuzz превосходит традиционные fuzzers в обнаружении новых протокольных состояний и уязвимостей. ## Значимость Такие результаты открывают новые возможности в области autonomic fuzzing. MultiFuzz может быть применен в различных областях, включая безопасность сетевых протоколов, анализ уязвимостей и тестирование сложных систем. Оно предлагает более надежный и структ

Abstract

Traditional protocol fuzzing techniques, such as those employed by AFL-based systems, often lack effectiveness due to a limited semantic understanding of complex protocol grammars and rigid seed mutation strategies. Recent works, such as ChatAFL, have integrated Large Language Models (LLMs) to guide protocol fuzzing and address these limitations, pushing protocol fuzzers to wider exploration of the protocol state space. But ChatAFL still faces issues like unreliable output, LLM hallucinations, and assumptions of LLM knowledge about protocol specifications. This paper introduces MultiFuzz, a novel dense retrieval-based multi-agent system designed to overcome these limitations by integrating semantic-aware context retrieval, specialized agents, and structured tool-assisted reasoning. MultiFuzz utilizes agentic chunks of protocol documentation (RFC Documents) to build embeddings in a vector database for a retrieval-augmented generation (RAG) pipeline, enabling agents to generate more reliable and structured outputs, enhancing the fuzzer in mutating protocol messages with enhanced state coverage and adherence to syntactic constraints. The framework decomposes the fuzzing process into modular groups of agents that collaborate through chain-of-thought reasoning to dynamically adapt fuzzing strategies based on the retrieved contextual knowledge. Experimental evaluations on the Real-Time Streaming Protocol (RTSP) demonstrate that MultiFuzz significantly improves branch coverage and explores deeper protocol states and transitions over state-of-the-art (SOTA) fuzzers such as NSFuzz, AFLNet, and ChatAFL. By combining dense retrieval, agentic coordination, and language model reasoning, MultiFuzz establishes a new paradigm in autonomous protocol fuzzing, offering a scalable and extensible foundation for future research in intelligent agentic-based fuzzing systems.

Ссылки и действия