Exploring LLM-based Frameworks for Fault Diagnosis
2509.23113v1
cs.AI, cs.CY
2025-10-01
Авторы:
Xian Yeow Lee, Lasitha Vidyaratne, Ahmed Farahat, Chetan Gupta
Резюме на русском
## Контекст
Large Language Models (LLM) широко применяются в индустриальных средах для автоматизации и улучшения процессов мониторинга и диагностики оборудования. Однако существуют значительные проблемы в их применении, связанные с необходимостью обеспечить высокую точность, удобную интерпретируемость и способность к адаптации в динамичных средах. Недостаток внимательного анализа этих аспектов ограничивает потенциал LLMs в области диагностики. Целью данного исследования является изучение возможностей LLM-based фреймворков для диагностики неисправностей, а также оценка их преимуществ и ограничений в решении этой задачи.
## Метод
Для расширения возможностей LLM-based системы в диагностике неисправностей был разработан метод, основанный на архитектуре с использованием одного или нескольких LLMs с различными входными данными. Входные данные были представлены в двух формах: на основе статистических описательных показателей или напрямую из сырых данных сенсоров. Архитектура системы позволяла экспериментировать с различными конфигурациями, включая размер окна контекста и способ выдачи ответов. В качестве условий для экспериментов использовались данные от различных сенсоров, отражающих различные сценарии неисправности. Эксперименты проводились для сравнения одного LLM с несколькими LLMs, чтобы определить наилучшую конфигурацию для улучшения производительности диагностики.
## Результаты
На основе проведенных экспериментов обнаружилось, что LLM-системы, использующие статистические описательные входные данные, показали лучшую точность и точность классификации неисправностей по сравнению с теми, которые используют сырые данные. Кроме того, системы с несколькими LLMs специализированными приглашениями (prompts) демонстрировали высшую точность и чувствительность к классам неисправностей по сравнению с одним LLM. Латентностью результатов является то, что LLM-системы могут создавать подробные и понятные для человека объяснения своих решений. Однако были выявлены ограничения, в частности, системы имеют сложности в адаптации к продолжительным циклам повторяющихся неисправностей.
## Значимость
Полученные результаты указывают на возможности LLM-based фреймворков для диагностики неисправностей в индустрии. Они могут быть использованы в таких областях, как техническое обслуживание, промышленность и автоматизация. Из систем LLMs выделяются преимущества, такие как высокая точность, удобность в интерпретации результатов, а также возможность проведения анализа в реальном времени. Однако существуют ограничения в способности адаптироваться к изменениям в данных и в продолжительных
Abstract
Large Language Model (LLM)-based systems present new opportunities for
autonomous health monitoring in sensor-rich industrial environments. This study
explores the potential of LLMs to detect and classify faults directly from
sensor data, while producing inherently explainable outputs through natural
language reasoning. We systematically evaluate how LLM-system architecture
(single-LLM vs. multi-LLM), input representations (raw vs. descriptive
statistics), and context window size affect diagnostic performance. Our
findings show that LLM systems perform most effectively when provided with
summarized statistical inputs, and that systems with multiple LLMs using
specialized prompts offer improved sensitivity for fault classification
compared to single-LLM systems. While LLMs can produce detailed and
human-readable justifications for their decisions, we observe limitations in
their ability to adapt over time in continual learning settings, often
struggling to calibrate predictions during repeated fault cycles. These
insights point to both the promise and the current boundaries of LLM-based
systems as transparent, adaptive diagnostic tools in complex environments.
Ссылки и действия
Дополнительные ресурсы: