An Enhanced Focal Loss Function to Mitigate Class Imbalance in Auto Insurance Fraud Detection with Explainable AI

2508.02283v1 cs.LG, q-fin.CP, q-fin.RM 2025-08-09
Авторы:

Francis Boabang, Samuel Asante Gyamerah

Резюме на русском

#### Контекст Обработка несбалансированных классов — одна из ключевых проблем в задачах машинного обучения, особенно в области обнаружения мошенничества. Это относится и к сфере автомобильного страхования, где значительная часть классов относится к немошенническим случаям. Недостаточная учетная веса и неточность моделей приводят к высоким темпам ложноположительных и ложноотрицательных результатов. Для улучшения точности модели, а также для повышения их интерпретируемости, необходимо разработать новый подход к обнаружению мошенничества. #### Метод Разработанная модификация фокусной потери (focal loss) представляет собой динамическую многоступенчатую методику, которая увеличивает веса на трудноотличимые между собой объекты в процессе обучения. Это достигается за счет использования динамического коэффициента, который регулирует темп обучения в зависимости от текущего состояния модели. Для обеспечения интерпретируемости решений включены методы вывода (explanation methods), позволяющие пользователю понять, почему модель пришла к определенному выводу. #### Результаты Эксперименты проводились на реальной автомобильной страховой выборке. Были сравнены результаты модифицированной фокусной потери с стандартной версией. Модель с многоступенчатым фокусным потери показала лучшие результаты по метрикам точности (accuracy), долей правильных определений (precision), F1-меры и AUC-ROC. Эти результаты подтверждают улучшение модели в трудных классификационных задачах и повышение ее устойчивости к несбалансированным данным. #### Значимость Предложенный подход может быть применен в системах обнаружения мошенничества в страховании и других областях, где несбалансированные классы являются типичной проблемой. Добавление интерпретируемости сделало модель более прозрачной и доверительной для пользователей. Это может повысить доверие к системе и снизить риск ошибочных определений. #### Выводы Разработанная модифицированная фокусная потеря проявила значительное улучшение производительности модели в сравнении с стандартным подходом. Будущие исследования будут направлены на дальнейшее повышение точности и многообразия методов интерпретации решений модели.

Abstract

In insurance fraud prediction, handling class imbalance remains a critical challenge. This paper presents a novel multistage focal loss function designed to enhance the performance of machine learning models in such imbalanced settings by helping to escape local minima and converge to a good solution. Building upon the foundation of the standard focal loss, our proposed approach introduces a dynamic, multi-stage convex and nonconvex mechanism that progressively adjusts the focus on hard-to-classify samples across training epochs. This strategic refinement facilitates more stable learning and improved discrimination between fraudulent and legitimate cases. Through extensive experimentation on a real-world insurance dataset, our method achieved better performance than the traditional focal loss, as measured by accuracy, precision, F1-score, recall and Area Under the Curve (AUC) metrics on the auto insurance dataset. These results demonstrate the efficacy of the multistage focal loss in boosting model robustness and predictive accuracy in highly skewed classification tasks, offering significant implications for fraud detection systems in the insurance industry. An explainable model is included to interpret the results.

Ссылки и действия