Post-hoc LLM-Supported Debugging of Distributed Processes
2508.14540v1
cs.SE, cs.AI
2025-08-22
Авторы:
Dennis Schiese, Andreas Both
Резюме на русском
## Контекст
Современные дистрибутивные программные системы становятся все более сложными, что усложняет процесс их отладки. Отладка в ручном режиме требует больших затрат ресурсов и часто остается архаичной. Недостаток эффективных инструментов для понимания поведения процессов и их потенциальных ошибок становится критичным, особенно при работе с компонентно-ориентированными системами. Это проблема мотивирует разработку методов, которые могли бы облегчить отладку, даже для разработчиков, не знакомых с подробностями системы. Статья предлагает использовать генерируемую с помощью AI синтетическую документацию для улучшения объяснения поведения системы и помощи разработчикам в поиске ошибок.
## Метод
Методология основывается на использовании генерируемого с помощью трансформаторов естественного языка (LLM) синтетической документации. Это делается путем обработки данных процессов, интерфейсов и документации. Архитектура подхода включает три основных этапа: 1) загрузка данных процесса; 2) обработка данных и генерация естественного языка; 3) отображение результатов в понятном виде. Разработанная платформа использует технологию LLM для обеспечения естественного языка и поддержки разработчиков, даже при незначительном знании системы. Демонстратор реализован в виде веб-приложения на базе Java.
## Результаты
Проведены эксперименты на реальной компонентно-ориентированной системе на языке Java. Результаты показали, что синтетическая документация помогает разработчикам быстрее понять поведение системы и ошибки. Использованы данные реальных процессов, позволившие протестировать подход на реальных задачах отладки. Результаты демонстрируют, что LLM-поддержка повышает эффективность отладки, даже если разработчик не знаком с системой на глубоком уровне. Результаты были получены с использованием тестовых наборов данных, настроенных на реальных сценариях отладки.
## Значимость
Предложенный подход может широко применяться в разработке программного обеспечения, особенно в процессе отладки компонентных систем. Он обеспечивает повышение эффективности отладки благодаря естественному языку и синтетической документации. Основные преимущества включают снижение времени отладки, уменьшение необходимости ручных исследований, и повышение удобочитаемости результатов. Это может существенно снизить затраты на отладку и помочь разработчикам быстрее решать проблемы.
## Выводы
Основным достижением является представление нового подхода к отладке компонентных дистрибутивных систем, основанном на LLM. Результаты экспериментов показали, что этот подход эффективен
Abstract
In this paper, we address the problem of manual debugging, which nowadays
remains resource-intensive and in some parts archaic. This problem is
especially evident in increasingly complex and distributed software systems.
Therefore, our objective of this work is to introduce an approach that can
possibly be applied to any system, at both the macro- and micro-level, to ease
this debugging process. This approach utilizes a system's process data, in
conjunction with generative AI, to generate natural-language explanations.
These explanations are generated from the actual process data, interface
information, and documentation to guide the developers more efficiently to
understand the behavior and possible errors of a process and its sub-processes.
Here, we present a demonstrator that employs this approach on a component-based
Java system. However, our approach is language-agnostic. Ideally, the generated
explanations will provide a good understanding of the process, even if
developers are not familiar with all the details of the considered system. Our
demonstrator is provided as an open-source web application that is freely
accessible to all users.
Ссылки и действия
Дополнительные ресурсы: