An Enhanced Focal Loss Function to Mitigate Class Imbalance in Auto Insurance Fraud Detection with Explainable AI
2508.02283v1
cs.LG, q-fin.CP, q-fin.RM
2025-08-09
Авторы:
Francis Boabang, Samuel Asante Gyamerah
Резюме на русском
#### Контекст
Обработка несбалансированных классов — одна из ключевых проблем в задачах машинного обучения, особенно в области обнаружения мошенничества. Это относится и к сфере автомобильного страхования, где значительная часть классов относится к немошенническим случаям. Недостаточная учетная веса и неточность моделей приводят к высоким темпам ложноположительных и ложноотрицательных результатов. Для улучшения точности модели, а также для повышения их интерпретируемости, необходимо разработать новый подход к обнаружению мошенничества.
#### Метод
Разработанная модификация фокусной потери (focal loss) представляет собой динамическую многоступенчатую методику, которая увеличивает веса на трудноотличимые между собой объекты в процессе обучения. Это достигается за счет использования динамического коэффициента, который регулирует темп обучения в зависимости от текущего состояния модели. Для обеспечения интерпретируемости решений включены методы вывода (explanation methods), позволяющие пользователю понять, почему модель пришла к определенному выводу.
#### Результаты
Эксперименты проводились на реальной автомобильной страховой выборке. Были сравнены результаты модифицированной фокусной потери с стандартной версией. Модель с многоступенчатым фокусным потери показала лучшие результаты по метрикам точности (accuracy), долей правильных определений (precision), F1-меры и AUC-ROC. Эти результаты подтверждают улучшение модели в трудных классификационных задачах и повышение ее устойчивости к несбалансированным данным.
#### Значимость
Предложенный подход может быть применен в системах обнаружения мошенничества в страховании и других областях, где несбалансированные классы являются типичной проблемой. Добавление интерпретируемости сделало модель более прозрачной и доверительной для пользователей. Это может повысить доверие к системе и снизить риск ошибочных определений.
#### Выводы
Разработанная модифицированная фокусная потеря проявила значительное улучшение производительности модели в сравнении с стандартным подходом. Будущие исследования будут направлены на дальнейшее повышение точности и многообразия методов интерпретации решений модели.
Abstract
In insurance fraud prediction, handling class imbalance remains a critical
challenge. This paper presents a novel multistage focal loss function designed
to enhance the performance of machine learning models in such imbalanced
settings by helping to escape local minima and converge to a good solution.
Building upon the foundation of the standard focal loss, our proposed approach
introduces a dynamic, multi-stage convex and nonconvex mechanism that
progressively adjusts the focus on hard-to-classify samples across training
epochs. This strategic refinement facilitates more stable learning and improved
discrimination between fraudulent and legitimate cases. Through extensive
experimentation on a real-world insurance dataset, our method achieved better
performance than the traditional focal loss, as measured by accuracy,
precision, F1-score, recall and Area Under the Curve (AUC) metrics on the auto
insurance dataset. These results demonstrate the efficacy of the multistage
focal loss in boosting model robustness and predictive accuracy in highly
skewed classification tasks, offering significant implications for fraud
detection systems in the insurance industry. An explainable model is included
to interpret the results.