Foe for Fraud: Transferable Adversarial Attacks in Credit Card Fraud Detection
2508.14699v1
cs.CR, cs.AI
2025-08-22
Авторы:
Jan Lum Fok, Qingwen Zeng, Shiping Chen, Oscar Fawkes, Huaming Chen
Резюме на русском
## Контекст
Credit card fraud detection (CCFD) является критическим приложением машинного обучения (ML) в финансовой сфере, где точное выявление мошеннических транзакций критически важно для снижения финансовых потерь. ML-модели показали свою эффективность в решении задач по детекции мошенничества, особенно в работе с табулярными данными. Однако влияние адверсарных атак на такие модели, особенно на промышленные модели CCFD, до сих пор значительно не исследовано. Эти незаметные уязвимости представляют значительную угрозу для безопасности и устойчивости финансовой отрасли, особенно при высокоценных транзакциях, где потери могут быть великолепными. Данная работа стремится установить уязвимости табулярных данных CCFD под угрозой адверсарных атак, чтобы подчеркнуть необходимость развития защитных методов.
## Метод
Мы предлагаем подробный фреймворк для исследования уязвимостей CCFD-моделей под действием адверсарных атак. Методология включает интеграцию gradient-based attack методов в табулярные данные транзакций кредитных карт в black- и white-box settings. Данные были специально подготовлены с целью оценки того, насколько табулярные данные уязвимы к малейшим подборам, направленным на деформацию машинного обучения. Мы также проверили, насколько эффективны transfering attacks между разными моделями, включая gradient- и non-gradient-based models.
## Результаты
Наши эксперименты показали, что табулярные данные CCFD остаются уязвимыми даже на малых подборах, вне зависимости от типа атаки. Мы показали, что gradient-based attacks могут эффективно повлиять на ML-модели в случае black-box и white-box атак, а также успешно перенесены с одной модели на другую. Это подтверждает, что tabular data CCFD является склонным к таким атакам, которые могут вызвать заметные потери в работе системы детекции мошенничества.
## Значимость
Наши результаты имеют большое значение для индустрии финансовых технологий. Они подчеркивают необходимость создания более надежных и устойчивых моделей CCFD, особенно в области высокоценных транзакций. Это может вести к развитию новых защитных методов, увеличению уровня безопасности и улучшению надежности технологий в финансовой сфере.
## Выводы
Данная работа показала, что табулярные данные CCFD остаются уязвимыми к адверсарным атакам, даже в случае затрудненного доступа к модели. Мы также подтвердили, что такие атаки могут быть эффективно перенесены между разными моделями. Наши результаты обнаружили существующие уязвимости и подчеркнули необходимость развития новых защитных методов для CCFD. Будущие исследования будут направлены на развитие более устойчивых моделей и методов обнаружения адверсарных атак в CCFD.
Abstract
Credit card fraud detection (CCFD) is a critical application of Machine
Learning (ML) in the financial sector, where accurately identifying fraudulent
transactions is essential for mitigating financial losses. ML models have
demonstrated their effectiveness in fraud detection task, in particular with
the tabular dataset. While adversarial attacks have been extensively studied in
computer vision and deep learning, their impacts on the ML models, particularly
those trained on CCFD tabular datasets, remains largely unexplored. These
latent vulnerabilities pose significant threats to the security and stability
of the financial industry, especially in high-value transactions where losses
could be substantial. To address this gap, in this paper, we present a holistic
framework that investigate the robustness of CCFD ML model against adversarial
perturbations under different circumstances. Specifically, the gradient-based
attack methods are incorporated into the tabular credit card transaction data
in both black- and white-box adversarial attacks settings. Our findings confirm
that tabular data is also susceptible to subtle perturbations, highlighting the
need for heightened awareness among financial technology practitioners
regarding ML model security and trustworthiness. Furthermore, the experiments
by transferring adversarial samples from gradient-based attack method to
non-gradient-based models also verify our findings. Our results demonstrate
that such attacks remain effective, emphasizing the necessity of developing
robust defenses for CCFD algorithms.
Ссылки и действия
Дополнительные ресурсы: