From Legacy to Standard: LLM-Assisted Transformation of Cybersecurity Playbooks into CACAO Format
2508.03342v1
cs.CR, cs.AI
2025-08-06
Авторы:
Mehdi Akbari Gurabi, Lasse Nitz, Radu-Mihai Castravet, Roman Matzutt, Avikarsha Mandal, Stefan Decker
Резюме на русском
**Резюме:**
Существующие кибербезопастностные плейбуки часто представлены в неструктурированных, немашиночитаемых форматах, что ограничивает их автоматизацию и взаимодействие с платформами Security Orchestration, Automation, and Response (SOAR). Данная статья предлагает метод автоматического преобразования таких плейбуков в стандартизированный, машиночитаемый формат CACAO, используя большие языковые модели (LLM) и методы Prompt Engineering. Разработанный модульный пайплайн включает синтаксический анализатор для обеспечения корректности и итеративный механизм уточнения для уменьшения синтаксических ошибок. Исследование проведено на базе набора данных с разнообразными плейбуками и соответствующими ручными CACAO-спецификациями. Результаты показывают, что предложенный подход значительно улучшает точность преобразования, эффективно обрабатывает сложные структуры рабочих процессов и существенно сокращает ошибки, демонстрируя практическую применимость в автоматизации кибербезопасностных задач.
Abstract
Existing cybersecurity playbooks are often written in heterogeneous,
non-machine-readable formats, which limits their automation and
interoperability across Security Orchestration, Automation, and Response
platforms. This paper explores the suitability of Large Language Models,
combined with Prompt Engineering, to automatically translate legacy incident
response playbooks into the standardized, machine-readable CACAO format. We
systematically examine various Prompt Engineering techniques and carefully
design prompts aimed at maximizing syntactic accuracy and semantic fidelity for
control flow preservation. Our modular transformation pipeline integrates a
syntax checker to ensure syntactic correctness and features an iterative
refinement mechanism that progressively reduces syntactic errors. We evaluate
the proposed approach on a custom-generated dataset comprising diverse legacy
playbooks paired with manually created CACAO references. The results
demonstrate that our method significantly improves the accuracy of playbook
transformation over baseline models, effectively captures complex workflow
structures, and substantially reduces errors. It highlights the potential for
practical deployment in automated cybersecurity playbook transformation tasks.
Ссылки и действия
Дополнительные ресурсы: