AMLNet: A Knowledge-Based Multi-Agent Framework to Generate and Detect Realistic Money Laundering Transactions
2509.11595v1
cs.AI, cs.CE, cs.CR, cs.LG, cs.MA
2025-09-17
Авторы:
Sabin Huda, Ernest Foo, Zahra Jadidi, MA Hakim Newton, Abdul Sattar
Резюме на русском
## Контекст
Антиденегоправонарушенческие (AML) исследования сталкиваются с ограничениями, связанными с отсутствием открытых, регулируемых транзакционных наборов данных. Это влечет за собой ограниченную возможность проверки новых методов AML в условиях реальных сценариев. Для преодоления этого ограничения необходимы реалистичные транзакции, соответствующие нормативным требованиям и имитирующие настоящую структуру денежной цепочки. Однако существующие подходы либо не достаточно регулируются, либо не достаточно реалистичны. Мы предлагаем AMLNet, который представляет собой крупномасштабный знаний-ориентированный многоагентный фреймворк, состоящий из двух составляющих: регулируемого транзакционного генератора и ассемблированной системы детекции.
## Метод
AMLNet основывается на параллельном подходе к моделированию транзакций. Генератор транзакций использует **Multi-Agent Deep Reinforcement Learning (MADRL)** для создания регулируемых транзакций. Он обеспечивает реалистичность на каждом этапе цепочки денежной очистки (placement, layering, integration) и включает передовые типологии, такие как структурирование и адаптивное поведение по порогам. Ассемблированная система детекции включает **ensemble of classifiers**, такие как **XGBoost**, **Random Forest** и **Neural Networks**, работающие в рамках **ensemble learning**. Отдельно, в AMLNet используются **Graph Neural Networks (GNN)** для сетевого моделирования, чтобы обнаруживать сетевые модели доверия и скрытых структур, связанных с денежной очисткой.
## Результаты
Мы провели эксперименты, используя 1,090,173 генерируемых транзакций, искуственно обогащенных реалистичными сценариями. Транзакции были разбиты на тестовые и обучающие наборы, где F1-меру достигают **0.90** (precision **0.84**, recall **0.97**). Датасет AMLNet был протестирован с помощью внешнего набора данных **SynthAML**, подтверждая гибкость и общий подход. Кроме того, детекторы показали результаты **0.75** для **composite technical fidelity score**, что характеризует реалистичность транзакций на уровне структуры, временной динамики и поведения.
## Значимость
AMLNet может применяться в сфере **AML experimentation** для создания синтетических транзакций, которые позволяют проверять системы обнаружения AML в условиях реальных сценариев. Он поддерживает **regulatory alignment**, **temporal and behavioral fidelity**, и **network modeling**, что расширяет возможности для экспериментации в AML. Этот подход может повысить качество систем обнаружения AML и обеспечить более эффективную проверку новых моделей.
## Выводы
AMLNet является первым крупномасштабным фреймворком, который объединяет регулируемость, реалистичность и моделирование цепочки денежной очистки. Он демонстрирует высоки
Abstract
Anti-money laundering (AML) research is constrained by the lack of publicly
shareable, regulation-aligned transaction datasets. We present AMLNet, a
knowledge-based multi-agent framework with two coordinated units: a
regulation-aware transaction generator and an ensemble detection pipeline. The
generator produces 1,090,173 synthetic transactions (approximately 0.16\%
laundering-positive) spanning core laundering phases (placement, layering,
integration) and advanced typologies (e.g., structuring, adaptive threshold
behavior). Regulatory alignment reaches 75\% based on AUSTRAC rule coverage
(Section 4.2), while a composite technical fidelity score of 0.75 summarizes
temporal, structural, and behavioral realism components (Section 4.4). The
detection ensemble achieves F1 0.90 (precision 0.84, recall 0.97) on the
internal test partitions of AMLNet and adapts to the external SynthAML dataset,
indicating architectural generalizability across different synthetic generation
paradigms. We provide multi-dimensional evaluation (regulatory, temporal,
network, behavioral) and release the dataset (Version 1.0,
https://doi.org/10.5281/zenodo.16736515), to advance reproducible and
regulation-conscious AML experimentation.