Post-hoc LLM-Supported Debugging of Distributed Processes

2508.14540v1 cs.SE, cs.AI 2025-08-22

Авторы:

Dennis Schiese, Andreas Both

Резюме на русском

## Контекст Современные дистрибутивные программные системы становятся все более сложными, что усложняет процесс их отладки. Отладка в ручном режиме требует больших затрат ресурсов и часто остается архаичной. Недостаток эффективных инструментов для понимания поведения процессов и их потенциальных ошибок становится критичным, особенно при работе с компонентно-ориентированными системами. Это проблема мотивирует разработку методов, которые могли бы облегчить отладку, даже для разработчиков, не знакомых с подробностями системы. Статья предлагает использовать генерируемую с помощью AI синтетическую документацию для улучшения объяснения поведения системы и помощи разработчикам в поиске ошибок. ## Метод Методология основывается на использовании генерируемого с помощью трансформаторов естественного языка (LLM) синтетической документации. Это делается путем обработки данных процессов, интерфейсов и документации. Архитектура подхода включает три основных этапа: 1) загрузка данных процесса; 2) обработка данных и генерация естественного языка; 3) отображение результатов в понятном виде. Разработанная платформа использует технологию LLM для обеспечения естественного языка и поддержки разработчиков, даже при незначительном знании системы. Демонстратор реализован в виде веб-приложения на базе Java. ## Результаты Проведены эксперименты на реальной компонентно-ориентированной системе на языке Java. Результаты показали, что синтетическая документация помогает разработчикам быстрее понять поведение системы и ошибки. Использованы данные реальных процессов, позволившие протестировать подход на реальных задачах отладки. Результаты демонстрируют, что LLM-поддержка повышает эффективность отладки, даже если разработчик не знаком с системой на глубоком уровне. Результаты были получены с использованием тестовых наборов данных, настроенных на реальных сценариях отладки. ## Значимость Предложенный подход может широко применяться в разработке программного обеспечения, особенно в процессе отладки компонентных систем. Он обеспечивает повышение эффективности отладки благодаря естественному языку и синтетической документации. Основные преимущества включают снижение времени отладки, уменьшение необходимости ручных исследований, и повышение удобочитаемости результатов. Это может существенно снизить затраты на отладку и помочь разработчикам быстрее решать проблемы. ## Выводы Основным достижением является представление нового подхода к отладке компонентных дистрибутивных систем, основанном на LLM. Результаты экспериментов показали, что этот подход эффективен

Abstract

In this paper, we address the problem of manual debugging, which nowadays remains resource-intensive and in some parts archaic. This problem is especially evident in increasingly complex and distributed software systems. Therefore, our objective of this work is to introduce an approach that can possibly be applied to any system, at both the macro- and micro-level, to ease this debugging process. This approach utilizes a system's process data, in conjunction with generative AI, to generate natural-language explanations. These explanations are generated from the actual process data, interface information, and documentation to guide the developers more efficiently to understand the behavior and possible errors of a process and its sub-processes. Here, we present a demonstrator that employs this approach on a component-based Java system. However, our approach is language-agnostic. Ideally, the generated explanations will provide a good understanding of the process, even if developers are not familiar with all the details of the considered system. Our demonstrator is provided as an open-source web application that is freely accessible to all users.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Post-hoc LLM-Supported Debugging of Distributed Processes

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Automating Complex Document Workflows via Stepwise and Rollback-Enabled Operatio...

Quantitative Analysis of Technical Debt and Pattern Violation in Large Language ...

MANTRA: a Framework for Multi-stage Adaptive Noise TReAtment During Training

Beyond Greenfield: The D3 Framework for AI-Driven Productivity in Brownfield Eng...

LLM-as-a-Judge for Scalable Test Coverage Evaluation: Accuracy, Operational Reli...

Навигация