Why Bonds Fail Differently? Explainable Multimodal Learning for Multi-Class Default Prediction
2509.10802v1
q-fin.RM, cs.CL, cs.LG, q-fin.CP
2025-09-17
Авторы:
Yi Lu, Aifan Ling, Chaoqun Wang, Yaxin Xu
Резюме на русском
## Контекст
В 2022 году в Китае произошло значительное количество банкротств, что привело к возникновению кризиса на внутреннем рынке облигаций. Это связано с регулированием, макроэкономической неопределенностью и нестабильностью на финансовых рынках. Использование традиционных моделей машинного обучения для прогнозирования банкротств становится неэффективным из-за сложной структуры финансовых данных, сильных временных зависимостей и отсутствия интерпретируемости. Улучшение моделей для более точных и интуитивных прогнозов является ключевым заданием в этой области.
## Метод
Предлагаемая модель EMDLOT (Explainable Multimodal Deep Learning for Time-series) является современным подходом к прогнозированию банкротств на рынке облигаций. Она объединяет в себе цифровые данные (финансовые и макроэкономические показатели) и неструктурированные текстовые данные (проспекты облигаций). Модель использует Time-Aware LSTM для обработки неправильно секвенциальных данных, а также soft clustering и многоуровневую аттенцию для повышения прозрачности. Она способна сформировать экономически обоснованные причины для прогнозируемых классов, что обеспечивает повышенной уровень доверия в модели.
## Результаты
Опытные исследования проводились на базе данных, включающей 1994 компаний в Китае за период с 2015 по 2024 год. EMDLOT показала значительное превосходство по показателям F1-score и mAP по сравнению с традиционными моделями (например, XGBoost) и даже с глубокими нейросетями (например, LSTM). Особенно выдачными были результаты в области классификации фирм, которые могут быть как банкроты, так и дефолтные. Анализы аблаций показали значительный вклад каждого компонента модели. Анализ аттенции позволил выявить наиболее важные факторы, влияющие на банкротство.
## Значимость
Модель EMDLOT может быть применена в сфере финансовых услуг для предупреждения рисков и прогнозирования банкротств. Она предоставляет достоверные интерпретации, что позволяет финансовым аналитикам и управляющим рискам принимать более обоснованные решения. Данная модель может стать стандартом для моделей, использующих многорежимные данные, и привнести новый знак в область моделирования финансового риска.
## Выводы
EMDLOT успешно объединяет многорежимные данные, обеспечивает высокую точность в прогнозировании банкротств и обеспечивает прозрачность решений. Будущие исследования будут фокусироваться на дальнейшем оптимизации моделей и исследовании других финансовых областей, в которых могут быть применены подобные подходы.
Abstract
In recent years, China's bond market has seen a surge in defaults amid
regulatory reforms and macroeconomic volatility. Traditional machine learning
models struggle to capture financial data's irregularity and temporal
dependencies, while most deep learning models lack interpretability-critical
for financial decision-making. To tackle these issues, we propose EMDLOT
(Explainable Multimodal Deep Learning for Time-series), a novel framework for
multi-class bond default prediction. EMDLOT integrates numerical time-series
(financial/macroeconomic indicators) and unstructured textual data (bond
prospectuses), uses Time-Aware LSTM to handle irregular sequences, and adopts
soft clustering and multi-level attention to boost interpretability.
Experiments on 1994 Chinese firms (2015-2024) show EMDLOT outperforms
traditional (e.g., XGBoost) and deep learning (e.g., LSTM) benchmarks in
recall, F1-score, and mAP, especially in identifying default/extended firms.
Ablation studies validate each component's value, and attention analyses reveal
economically intuitive default drivers. This work provides a practical tool and
a trustworthy framework for transparent financial risk modeling.