An Explainable Machine Learning Framework for Railway Predictive Maintenance using Data Streams from the Metro Operator of Portugal
2508.05388v1
cs.AI
2025-08-09
Авторы:
Silvia García-Méndez, Francisco de Arriba-Pérez, Fátima Leal, Bruno Veloso, Benedita Malheiro, Juan Carlos Burguillo-Rial
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Развитие Интеллюктуальных Транспортных Систем (ИТС) требует эффективных методов предиктивного обслуживания для обеспечения надёжности и безопасности операций. В сфере железнодорожного транспорта, особенно в метрополитенах, быстрое обнаружение и диагностика потенциальных неисправностей критично для снижения временных затрат, снижения рисков и повышения качества обслуживания. Однако, существующие подходы часто сталкиваются с проблемами, такими как нехватка реального времени в обработке данных, неспособность адаптироваться к динамическим изменениям, а также отсутствие прозрачности в процессе принятия решений.
Ключевой проблемой в предиктивном обслуживании является необходимость анализа данных потоков в реальном времени, чтобы предоставить точные прогнозы и понятные объяснения для оперативных решений. Традиционные модели машинного обучения могут достигать высокой точности, но их применение в реальных системах часто ограничено из-за невозможности обрабатывать несбалансированные данные, шум и другие внешние факторы. Кроме того, модели часто работают как "черные ящики", что создаёт дополнительные трудности для операторов и технических специалистов в понимании причин ошибок и принятии информированных решений.
В данной статье предлагается решение этих проблем путём разработки эксплицируемого машинного обучения для предиктивного обслуживания в метрополитене Порту (MetroPT). Целью исследования является создание комплексного решения, которое не только обеспечивает высокую точность прогнозов, но также предоставляет понятные объяснения решений модели для поддержки операторов в реальном времени.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Предлагаемый метод основывается на конвейере обработки данных, который включает три основных этапа: предварительная обработка, инкрементальная классификация и объяснение результатов. На этапе предварительной обработки, данные потока обрабатываются в реальном времени для извлечения статистических и частотных признаков. Этот модуль позволяет адаптироваться к динамическим изменениям в данных и обеспечивает высокую скорость обработки.
Для классификации используются инкрементальные модели машинного обучения, которые обновляются по мере поступления новых данных. Это позволяет модели оставаться актуальной и эффективной в условиях реального времени. Наконец, модуль объяснения предоставляет результаты в виде естественного языка и визуализаций, что упрощает восприятие информации операторами.
Архитектура системы ориентирована на обработку несбалансированных данных и шума, что является ключевым моментом для реальных приложений. Модели проверяются на наборе данных MetroPT, который включает различные сценарии неисправностей и нормального функционирования.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Эксперименты проведены на данных метрополитена Порту, которые представляют реальные условия работы системы. Модель достигает результатов выше 98% по мере F-measure и 99% по точности. Эти показатели подтверждают высокую эффективность системы в обнаружении неисправностей и снижении ложных срабатываний.
Эксперименты также показывают, что система сохраняет высокую производительность даже при наличии несбалансированных данных и шума, что демонстрирует её надёжность в реальных условиях. Визуальные и текстовые объяснения позволяют операторам быстро понять причины ошибок и принять соответствующие меры.
## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Предлагаемый метод имеет широкое применение в области железнодорожного транспорта, особенно в метрополитенах и других ИТС. Высокая точность и прозрачность решений позволяют снизить затраты на обслуживание, повысить безопасность и улучшить качество обслуживания пассажиров.
Практическая значимость заключается в возможности оперативного обнаружения неисправностей, что позволяет снизить время простоя и стоимость ремонта. Кроме того, прозрачные объяснения повышают доверие операторов к системе и облегчают процесс принятия решений.
## ВЫВОДЫ И ПЕРСПЕКТИВЫ
Результаты исследования подтверждают высокую эффективность предлагаемого метода в решении задач предиктивного обслуживания в железнодорожном транспорте. В будущем можно рассмотреть расширение этого подхода на другие области транспорта, а также использование более сложных моделей машинного обучения для дальнейшего повышения производительности. Также важно исследовать возможности интеграции этого метода с другими технологиями ИТС для создания более комплексных решений.
Abstract
This work contributes to a real-time data-driven predictive maintenance
solution for Intelligent Transportation Systems. The proposed method implements
a processing pipeline comprised of sample pre-processing, incremental
classification with Machine Learning models, and outcome explanation. This
novel online processing pipeline has two main highlights: (i) a dedicated
sample pre-processing module, which builds statistical and frequency-related
features on the fly, and (ii) an explainability module. This work is the first
to perform online fault prediction with natural language and visual
explainability. The experiments were performed with the MetroPT data set from
the metro operator of Porto, Portugal. The results are above 98 % for F-measure
and 99 % for accuracy. In the context of railway predictive maintenance,
achieving these high values is crucial due to the practical and operational
implications of accurate failure prediction. In the specific case of a high
F-measure, this ensures that the system maintains an optimal balance between
detecting the highest possible number of real faults and minimizing false
alarms, which is crucial for maximizing service availability. Furthermore, the
accuracy obtained enables reliability, directly impacting cost reduction and
increased safety. The analysis demonstrates that the pipeline maintains high
performance even in the presence of class imbalance and noise, and its
explanations effectively reflect the decision-making process. These findings
validate the methodological soundness of the approach and confirm its practical
applicability for supporting proactive maintenance decisions in real-world
railway operations. Therefore, by identifying the early signs of failure, this
pipeline enables decision-makers to understand the underlying problems and act
accordingly swiftly.
Ссылки и действия
Дополнительные ресурсы: