Foe for Fraud: Transferable Adversarial Attacks in Credit Card Fraud Detection

2508.14699v1 cs.CR, cs.AI 2025-08-22

Авторы:

Jan Lum Fok, Qingwen Zeng, Shiping Chen, Oscar Fawkes, Huaming Chen

Резюме на русском

## Контекст Credit card fraud detection (CCFD) является критическим приложением машинного обучения (ML) в финансовой сфере, где точное выявление мошеннических транзакций критически важно для снижения финансовых потерь. ML-модели показали свою эффективность в решении задач по детекции мошенничества, особенно в работе с табулярными данными. Однако влияние адверсарных атак на такие модели, особенно на промышленные модели CCFD, до сих пор значительно не исследовано. Эти незаметные уязвимости представляют значительную угрозу для безопасности и устойчивости финансовой отрасли, особенно при высокоценных транзакциях, где потери могут быть великолепными. Данная работа стремится установить уязвимости табулярных данных CCFD под угрозой адверсарных атак, чтобы подчеркнуть необходимость развития защитных методов. ## Метод Мы предлагаем подробный фреймворк для исследования уязвимостей CCFD-моделей под действием адверсарных атак. Методология включает интеграцию gradient-based attack методов в табулярные данные транзакций кредитных карт в black- и white-box settings. Данные были специально подготовлены с целью оценки того, насколько табулярные данные уязвимы к малейшим подборам, направленным на деформацию машинного обучения. Мы также проверили, насколько эффективны transfering attacks между разными моделями, включая gradient- и non-gradient-based models. ## Результаты Наши эксперименты показали, что табулярные данные CCFD остаются уязвимыми даже на малых подборах, вне зависимости от типа атаки. Мы показали, что gradient-based attacks могут эффективно повлиять на ML-модели в случае black-box и white-box атак, а также успешно перенесены с одной модели на другую. Это подтверждает, что tabular data CCFD является склонным к таким атакам, которые могут вызвать заметные потери в работе системы детекции мошенничества. ## Значимость Наши результаты имеют большое значение для индустрии финансовых технологий. Они подчеркивают необходимость создания более надежных и устойчивых моделей CCFD, особенно в области высокоценных транзакций. Это может вести к развитию новых защитных методов, увеличению уровня безопасности и улучшению надежности технологий в финансовой сфере. ## Выводы Данная работа показала, что табулярные данные CCFD остаются уязвимыми к адверсарным атакам, даже в случае затрудненного доступа к модели. Мы также подтвердили, что такие атаки могут быть эффективно перенесены между разными моделями. Наши результаты обнаружили существующие уязвимости и подчеркнули необходимость развития новых защитных методов для CCFD. Будущие исследования будут направлены на развитие более устойчивых моделей и методов обнаружения адверсарных атак в CCFD.

Abstract

Credit card fraud detection (CCFD) is a critical application of Machine Learning (ML) in the financial sector, where accurately identifying fraudulent transactions is essential for mitigating financial losses. ML models have demonstrated their effectiveness in fraud detection task, in particular with the tabular dataset. While adversarial attacks have been extensively studied in computer vision and deep learning, their impacts on the ML models, particularly those trained on CCFD tabular datasets, remains largely unexplored. These latent vulnerabilities pose significant threats to the security and stability of the financial industry, especially in high-value transactions where losses could be substantial. To address this gap, in this paper, we present a holistic framework that investigate the robustness of CCFD ML model against adversarial perturbations under different circumstances. Specifically, the gradient-based attack methods are incorporated into the tabular credit card transaction data in both black- and white-box adversarial attacks settings. Our findings confirm that tabular data is also susceptible to subtle perturbations, highlighting the need for heightened awareness among financial technology practitioners regarding ML model security and trustworthiness. Furthermore, the experiments by transferring adversarial samples from gradient-based attack method to non-gradient-based models also verify our findings. Our results demonstrate that such attacks remain effective, emphasizing the necessity of developing robust defenses for CCFD algorithms.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Foe for Fraud: Transferable Adversarial Attacks in Credit Card Fraud Detection

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Light-Weight Large Language Model File Format for Highly-Secure Model Distribu...

SoK: a Comprehensive Causality Analysis Framework for Large Language Model Secur...

Hey GPT-OSS, Looks Like You Got It - Now Walk Me Through It! An Assessment of th...

Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs

Large Language Model based Smart Contract Auditing with LLMBugScanner

Навигация