Why Bonds Fail Differently? Explainable Multimodal Learning for Multi-Class Default Prediction

2509.10802v1 q-fin.RM, cs.CL, cs.LG, q-fin.CP 2025-09-17
Авторы:

Yi Lu, Aifan Ling, Chaoqun Wang, Yaxin Xu

Резюме на русском

## Контекст В 2022 году в Китае произошло значительное количество банкротств, что привело к возникновению кризиса на внутреннем рынке облигаций. Это связано с регулированием, макроэкономической неопределенностью и нестабильностью на финансовых рынках. Использование традиционных моделей машинного обучения для прогнозирования банкротств становится неэффективным из-за сложной структуры финансовых данных, сильных временных зависимостей и отсутствия интерпретируемости. Улучшение моделей для более точных и интуитивных прогнозов является ключевым заданием в этой области. ## Метод Предлагаемая модель EMDLOT (Explainable Multimodal Deep Learning for Time-series) является современным подходом к прогнозированию банкротств на рынке облигаций. Она объединяет в себе цифровые данные (финансовые и макроэкономические показатели) и неструктурированные текстовые данные (проспекты облигаций). Модель использует Time-Aware LSTM для обработки неправильно секвенциальных данных, а также soft clustering и многоуровневую аттенцию для повышения прозрачности. Она способна сформировать экономически обоснованные причины для прогнозируемых классов, что обеспечивает повышенной уровень доверия в модели. ## Результаты Опытные исследования проводились на базе данных, включающей 1994 компаний в Китае за период с 2015 по 2024 год. EMDLOT показала значительное превосходство по показателям F1-score и mAP по сравнению с традиционными моделями (например, XGBoost) и даже с глубокими нейросетями (например, LSTM). Особенно выдачными были результаты в области классификации фирм, которые могут быть как банкроты, так и дефолтные. Анализы аблаций показали значительный вклад каждого компонента модели. Анализ аттенции позволил выявить наиболее важные факторы, влияющие на банкротство. ## Значимость Модель EMDLOT может быть применена в сфере финансовых услуг для предупреждения рисков и прогнозирования банкротств. Она предоставляет достоверные интерпретации, что позволяет финансовым аналитикам и управляющим рискам принимать более обоснованные решения. Данная модель может стать стандартом для моделей, использующих многорежимные данные, и привнести новый знак в область моделирования финансового риска. ## Выводы EMDLOT успешно объединяет многорежимные данные, обеспечивает высокую точность в прогнозировании банкротств и обеспечивает прозрачность решений. Будущие исследования будут фокусироваться на дальнейшем оптимизации моделей и исследовании других финансовых областей, в которых могут быть применены подобные подходы.

Abstract

In recent years, China's bond market has seen a surge in defaults amid regulatory reforms and macroeconomic volatility. Traditional machine learning models struggle to capture financial data's irregularity and temporal dependencies, while most deep learning models lack interpretability-critical for financial decision-making. To tackle these issues, we propose EMDLOT (Explainable Multimodal Deep Learning for Time-series), a novel framework for multi-class bond default prediction. EMDLOT integrates numerical time-series (financial/macroeconomic indicators) and unstructured textual data (bond prospectuses), uses Time-Aware LSTM to handle irregular sequences, and adopts soft clustering and multi-level attention to boost interpretability. Experiments on 1994 Chinese firms (2015-2024) show EMDLOT outperforms traditional (e.g., XGBoost) and deep learning (e.g., LSTM) benchmarks in recall, F1-score, and mAP, especially in identifying default/extended firms. Ablation studies validate each component's value, and attention analyses reveal economically intuitive default drivers. This work provides a practical tool and a trustworthy framework for transparent financial risk modeling.

Ссылки и действия