Secure mmWave Beamforming with Proactive-ISAC Defense Against Beam-Stealing Attacks

2508.02856v1 eess.SP, cs.AI, cs.NI 2025-08-09
Авторы:

Seyed Bagher Hashemi Natanzi, Hossein Mohammadi, Bo Tang, Vuk Marojevic

Резюме на русском

Миллиметровые волны (mmWave) — ключевой технология мультиконтекстного обеспечения высокой пропускной способности в сетях будущего. Однако эти системы подвержены атакам типа beam-stealing, что грозит их безопасностью и производительностью. Данная работа предлагает инновационный подход к противодействию таким угрозам с помощью Deep Reinforcement Learning (DRL). Агент DRL, основанный на усовершенствованном алгоритме Proximal Policy Optimization (PPO), проводит адаптивную оценку угроз в рамках интегрированного подхода Sensing and Communications (ISAC). Использование активного метода проверки подозрительных активностей позволяет DRL-агенту грамотно регулировать многомерное пространство действий в условиях высокой комплексности задачи. Обучение с использованием курсивной стратегии обеспечивает эффективное усвоение решений в критической области защиты. Тестирование показало, что разработанная система обеспечивает высокую степень атакованности — 92,8%, при сохранении высокой производительности системы — SINR > 13 dB. Это демонстрирует эффективность DRL в сочетании с ISAC для усиления безопасности mmWave-систем.

Abstract

Millimeter-wave (mmWave) communication systems face increasing susceptibility to advanced beam-stealing attacks, posing a significant physical layer security threat. This paper introduces a novel framework employing an advanced Deep Reinforcement Learning (DRL) agent for proactive and adaptive defense against these sophisticated attacks. A key innovation is leveraging Integrated Sensing and Communications (ISAC) capabilities for active, intelligent threat assessment. The DRL agent, built on a Proximal Policy Optimization (PPO) algorithm, dynamically controls ISAC probing actions to investigate suspicious activities. We introduce an intensive curriculum learning strategy that guarantees the agent experiences successful detection during training to overcome the complex exploration challenges inherent to such a security-critical task. Consequently, the agent learns a robust and adaptive policy that intelligently balances security and communication performance. Numerical results demonstrate that our framework achieves a mean attacker detection rate of 92.8% while maintaining an average user SINR of over 13 dB.

Ссылки и действия