VerilogLAVD: LLM-Aided Rule Generation for Vulnerability Detection in Verilog
2508.13092v2
cs.CR, cs.AI
2025-08-20
Авторы:
Xiang Long, Yingjie Xia, Xiyuan Chen, Li Kuang
Резюме на русском
#### Контекст
Правильное и прозрачное обнаружение проблем в проектах программных и аппаратных систем является ключевым фактором для их успешного развития. Одним из важнейших аспектов является обнаружение программных и технических недочетов во время раннего этапа разработки. Это позволяет существенно снизить затраты на их устранение. Одна из областей, где такая проблема стоит перед разработчиками, является обнаружение проблем в проектах верилог-кода (Verilog), используемых в микросхемах и интегральных схемах. Несмотря на развитие методов и средств проверки кода, необходимость профессионального знания и опыта является барьером для эффективного использования этих методов. Большинство существующих средств имеют ограниченную удобность использования, что приводит к повышению затрат на тренировку специалистов и работы с этими инструментами.
#### Метод
Мы предлагаем VerilogLAVD — первую систему, основанную на графе, для генерации правил для обнаружения проблем в коде Verilog. Наше решение основывается на создании универсального представления кода Verilog — Verilog Property Graph (VeriPG). Оно объединяет синтаксические данные из абстрактного синтаксического дерева (AST) и семантические данные из диаграммы управления потоком и зависимостей данных. Мы используем генеративные модели языка (LLM) для генерирования правил диагностики на основе описаний Common Weakness Enumeration (CWE). Эти правила используются в системе для поиска проблем в коде Verilog с помощью графовой методики.
#### Результаты
Мы проводили эксперименты с нашим подходом на выборке данных, состоящей из 77 проектов Verilog, покрывающих 12 типов проблем в рамках Common Weakness Enumeration. Наши результаты показали, что VerilogLAVD достигает F1-меры в 0.54. Этого значения значительно превышает результаты основных альтернативных моделей: LLM-only (F1-мера 0.23) и LLM с внешним знанием (F1-мера 0.27). Эти результаты указывают на преимущества нашего подхода в сравнении с другими методами и системами.
#### Значимость
VerilogLAVD предлагает новый подход к раннему обнаружению проблем в проектах Verilog, который может существенно упростить работу системы и уменьшить затраты на поиск ошибок. Мы видим применение этой системы в различных сферах разработки программного и аппаратного обеспечения, где необходима эффективная диагностика в ранних стадиях. Наш подход может повысить качество программного обеспечения и упростить процесс разработки, что может привести к выигрышу в времени и ресурсах.
#### Выводы
Наши результаты показывают, что VerilogLAVD является эффективным инструментом для обнаружения проблем в коде Verilog. Мы планируем продолжать рабо
Abstract
Timely detection of hardware vulnerabilities during the early design stage is
critical for reducing remediation costs. Existing early detection techniques
often require specialized security expertise, limiting their usability. Recent
efforts have explored the use of large language models (LLMs) for Verilog
vulnerability detection. However, LLMs struggle to capture the structure in
Verilog code, resulting in inconsistent detection results. To this end, we
propose VerilogLAVD, the first LLM-aided graph traversal rule generation
approach for Verilog vulnerability detection. Our approach introduces the
Verilog Property Graph (VeriPG), a unified representation of Verilog code. It
combines syntactic features extracted from the abstract syntax tree (AST) with
semantic information derived from control flow and data dependency graphs. We
leverage LLMs to generate VeriPG-based detection rules from Common Weakness
Enumeration (CWE) descriptions. These rules guide the rule executor that
traversal VeriPG for potential vulnerabilities. To evaluate VerilogLAVD, we
build a dataset collected from open-source repositories and synthesized data.
In our empirical evaluation on 77 Verilog designs encompassing 12 CWE types,
VerilogLAVD achieves an F1-score of 0.54. Compared to the LLM-only and LLM with
external knowledge baselines, VerilogLAVD improves F1-score by 0.31 and 0.27,
respectively.
Ссылки и действия
Дополнительные ресурсы: