Secure mmWave Beamforming with Proactive-ISAC Defense Against Beam-Stealing Attacks
2508.02856v1
eess.SP, cs.AI, cs.NI
2025-08-09
Авторы:
Seyed Bagher Hashemi Natanzi, Hossein Mohammadi, Bo Tang, Vuk Marojevic
Резюме на русском
Миллиметровые волны (mmWave) — ключевой технология мультиконтекстного обеспечения высокой пропускной способности в сетях будущего. Однако эти системы подвержены атакам типа beam-stealing, что грозит их безопасностью и производительностью. Данная работа предлагает инновационный подход к противодействию таким угрозам с помощью Deep Reinforcement Learning (DRL). Агент DRL, основанный на усовершенствованном алгоритме Proximal Policy Optimization (PPO), проводит адаптивную оценку угроз в рамках интегрированного подхода Sensing and Communications (ISAC). Использование активного метода проверки подозрительных активностей позволяет DRL-агенту грамотно регулировать многомерное пространство действий в условиях высокой комплексности задачи. Обучение с использованием курсивной стратегии обеспечивает эффективное усвоение решений в критической области защиты. Тестирование показало, что разработанная система обеспечивает высокую степень атакованности — 92,8%, при сохранении высокой производительности системы — SINR > 13 dB. Это демонстрирует эффективность DRL в сочетании с ISAC для усиления безопасности mmWave-систем.
Abstract
Millimeter-wave (mmWave) communication systems face increasing susceptibility
to advanced beam-stealing attacks, posing a significant physical layer security
threat. This paper introduces a novel framework employing an advanced Deep
Reinforcement Learning (DRL) agent for proactive and adaptive defense against
these sophisticated attacks. A key innovation is leveraging Integrated Sensing
and Communications (ISAC) capabilities for active, intelligent threat
assessment. The DRL agent, built on a Proximal Policy Optimization (PPO)
algorithm, dynamically controls ISAC probing actions to investigate suspicious
activities. We introduce an intensive curriculum learning strategy that
guarantees the agent experiences successful detection during training to
overcome the complex exploration challenges inherent to such a
security-critical task. Consequently, the agent learns a robust and adaptive
policy that intelligently balances security and communication performance.
Numerical results demonstrate that our framework achieves a mean attacker
detection rate of 92.8% while maintaining an average user SINR of over 13 dB.
Ссылки и действия
Дополнительные ресурсы: