Consistency of Selection Strategies for Fraud Detection

2509.18739v1 stat.ML, cs.LG 2025-09-25
Авторы:

Christos Revelas, Otilia Boldea, Bas J. M. Werker

Резюме на русском

## Контекст Объектом исследования является проблема выбора стратегий для обнаружения мошенничества в страховой отрасли. Традиционно страховые компании используют модели предсказания, ориентируясь на самые вероятные случаи мошенничества для детального рассмотрения. Однако такой подход может привести к непоследовательному обучению модели, так как выборка, используемая для обучения, зависит от стратегии выбора. Это приводит к зависимости данных и неэффективности обучения. Мотивация для исследования заключается в поиске стратегии, способной обеспечить консистентное обучение и улучшить точность модели. ## Метод Исследование основывается на аналогии с многоруким бандитом (multi-arm bandit) — задачей оптимизации, где нужно оптимально выбирать между вариантами, однако в данном случае вовлечена зависимость с выбором. Авторы предлагают рассматривать выбор стратегий в рамках бинарной регрессии и использовать методы случайного выбора для уменьшения зависимости. Для оценки консистентности стратегий используется формализация в форме максимального правдоподобия с учетом случайного выбора. Эксперименты проводятся с использованием симуляционных данных для моделирования ситуаций мошенничества. ## Результаты Результаты экспериментов показали, что часто используемая стратегия выбора может привести к неконсистентному обучению, так как зависимость от прошлых выборов не учитывается. В то же время, предложенная случайная стратегия демонстрирует консистентность и эффективность. Также сравнивались результаты с Томпсоновским выбором (Thompson sampling), показав, что этот метод может оказаться менее эффективным при оценке низких вероятностей мошенничества. ## Значимость Предложенная стратегия может быть применена в страховой отрасли для улучшения моделей обнаружения мошенничества. Её преимущество в том, что она обеспечивает консистентное обучение и эффективное использование данных. Более того, развитие таких методов может привести к более точным предсказаниям мошенничества, что в последствии уменьшит финансовые потери страховых компаний и повысит надежность системы. ## Выводы В результате исследования было доказано, что часто используемые стратегии выбора могут привести к неконсистентному обучению. Авторы предложили альтернативу — случайную стратегию, которая демонстрирует более высокую консистентность. Будущие исследования будут ориентированы на уточнение условий консистентности и поиске более эффективных алгоритмов для решения задачи мошенничества в страховой отрасли.

Abstract

This paper studies how insurers can chose which claims to investigate for fraud. Given a prediction model, typically only claims with the highest predicted propability of being fraudulent are investigated. We argue that this can lead to inconsistent learning and propose a randomized alternative. More generally, we draw a parallel with the multi-arm bandit literature and argue that, in the presence of selection, the obtained observations are not iid. Hence, dependence on past observations should be accounted for when updating parameter estimates. We formalize selection in a binary regression framework and show that model updating and maximum-likelihood estimation can be implemented as if claims were investigated at random. Then, we define consistency of selection strategies and conjecture sufficient conditions for consistency. Our simulations suggest that the often-used selection strategy can be inconsistent while the proposed randomized alternative is consistent. Finally, we compare our randomized selection strategy with Thompson sampling, a standard multi-arm bandit heuristic. Our simulations suggest that the latter can be inefficient in learning low fraud probabilities.

Ссылки и действия