VerilogLAVD: LLM-Aided Rule Generation for Vulnerability Detection in Verilog

2508.13092v2 cs.CR, cs.AI 2025-08-20

Авторы:

Xiang Long, Yingjie Xia, Xiyuan Chen, Li Kuang

Резюме на русском

#### Контекст Правильное и прозрачное обнаружение проблем в проектах программных и аппаратных систем является ключевым фактором для их успешного развития. Одним из важнейших аспектов является обнаружение программных и технических недочетов во время раннего этапа разработки. Это позволяет существенно снизить затраты на их устранение. Одна из областей, где такая проблема стоит перед разработчиками, является обнаружение проблем в проектах верилог-кода (Verilog), используемых в микросхемах и интегральных схемах. Несмотря на развитие методов и средств проверки кода, необходимость профессионального знания и опыта является барьером для эффективного использования этих методов. Большинство существующих средств имеют ограниченную удобность использования, что приводит к повышению затрат на тренировку специалистов и работы с этими инструментами. #### Метод Мы предлагаем VerilogLAVD — первую систему, основанную на графе, для генерации правил для обнаружения проблем в коде Verilog. Наше решение основывается на создании универсального представления кода Verilog — Verilog Property Graph (VeriPG). Оно объединяет синтаксические данные из абстрактного синтаксического дерева (AST) и семантические данные из диаграммы управления потоком и зависимостей данных. Мы используем генеративные модели языка (LLM) для генерирования правил диагностики на основе описаний Common Weakness Enumeration (CWE). Эти правила используются в системе для поиска проблем в коде Verilog с помощью графовой методики. #### Результаты Мы проводили эксперименты с нашим подходом на выборке данных, состоящей из 77 проектов Verilog, покрывающих 12 типов проблем в рамках Common Weakness Enumeration. Наши результаты показали, что VerilogLAVD достигает F1-меры в 0.54. Этого значения значительно превышает результаты основных альтернативных моделей: LLM-only (F1-мера 0.23) и LLM с внешним знанием (F1-мера 0.27). Эти результаты указывают на преимущества нашего подхода в сравнении с другими методами и системами. #### Значимость VerilogLAVD предлагает новый подход к раннему обнаружению проблем в проектах Verilog, который может существенно упростить работу системы и уменьшить затраты на поиск ошибок. Мы видим применение этой системы в различных сферах разработки программного и аппаратного обеспечения, где необходима эффективная диагностика в ранних стадиях. Наш подход может повысить качество программного обеспечения и упростить процесс разработки, что может привести к выигрышу в времени и ресурсах. #### Выводы Наши результаты показывают, что VerilogLAVD является эффективным инструментом для обнаружения проблем в коде Verilog. Мы планируем продолжать рабо

Abstract

Timely detection of hardware vulnerabilities during the early design stage is critical for reducing remediation costs. Existing early detection techniques often require specialized security expertise, limiting their usability. Recent efforts have explored the use of large language models (LLMs) for Verilog vulnerability detection. However, LLMs struggle to capture the structure in Verilog code, resulting in inconsistent detection results. To this end, we propose VerilogLAVD, the first LLM-aided graph traversal rule generation approach for Verilog vulnerability detection. Our approach introduces the Verilog Property Graph (VeriPG), a unified representation of Verilog code. It combines syntactic features extracted from the abstract syntax tree (AST) with semantic information derived from control flow and data dependency graphs. We leverage LLMs to generate VeriPG-based detection rules from Common Weakness Enumeration (CWE) descriptions. These rules guide the rule executor that traversal VeriPG for potential vulnerabilities. To evaluate VerilogLAVD, we build a dataset collected from open-source repositories and synthesized data. In our empirical evaluation on 77 Verilog designs encompassing 12 CWE types, VerilogLAVD achieves an F1-score of 0.54. Compared to the LLM-only and LLM with external knowledge baselines, VerilogLAVD improves F1-score by 0.31 and 0.27, respectively.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

VerilogLAVD: LLM-Aided Rule Generation for Vulnerability Detection in Verilog

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Light-Weight Large Language Model File Format for Highly-Secure Model Distribu...

SoK: a Comprehensive Causality Analysis Framework for Large Language Model Secur...

Hey GPT-OSS, Looks Like You Got It - Now Walk Me Through It! An Assessment of th...

Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs

Large Language Model based Smart Contract Auditing with LLMBugScanner

Навигация