Game-Theoretic Resilience Framework for Cyber-Physical Microgrids using Multi-Agent Reinforcement Learning
2509.08310v1
eess.SY, cs.AI, cs.GT, cs.SY
2025-09-12
Авторы:
S Krishna Niketh, Sagar Babu Mitikiri, V Vignesh, Vedantham Lakshmi Srinivas, Mayukha Pal
Резюме на русском
## Контекст
Современные системы энергетического потребления становятся все более зависимыми от киберфизических систем, что усиливает риск направленных атак в сфере кибербезопасности. Это направляет внимание на развитие эффективных методов укрепления резильентности. Особенно актуальным становится использование киберфизических микросетов, которые обладают сложной структурой и требуют сложных стратегий управления. Целью данной статьи является разработка математически корректного фреймворка для оценки резильентности микросетов, используя теорию игр и мульти-агентные глубокие оптимизационные алгоритмы.
## Метод
В статье предлагается формализовать модель резильентности микросетов с использованием теории игр и мульти-агентного метода. Авторы разработали метрики, включающие: Мощность Сервируемой Загрузки (LSR), Критическую Загрузку (CLR), Топологическую Устойчивость (TSS) и Метрику Дистрибьютора Энергии (DER). Эти метрики включены в однородную матрицу взаимодействий атаки-обороны с помощью Аналитического Иерархического Процесса (AHP). Основным методологическим подходом является Finite Horizon Markov Decision Process (MDP), где для проблемы оптимизации решается задача взаимодействия временных рядов с помощью мульти-агентного глубокого обучения.
## Результаты
Для тестирования фреймворка, авторы использовали модель IEEE 33-узлов с сетями управления и DER (Distributed Energy Resources). Для оценки результатов, разработчики провели три эксперимента:
1. Анализ статических атак с использованием Нашевого равновесия;
2. Анализ серьезных атак, включающих высокоэффективные стратегии;
3. Адаптивные атаки с использованием Stackelberg-игр, regret matching, softmax-распределения и мульти-агентного Q-learning.
Результаты показали, что адаптивные стратегии увеличивают LSR на 18.7% и CLR на 2.1% в сравнении с статическими методами. Также были описаны вычислительные анализы сложности и были демонстрированы гарантии обучения с помощью PAC.
## Значимость
Разработанный фреймворк может быть применен в различных киберфизических системах, включая гриды с высокой степенью динамики и сложности. Он демонстрирует преимущества стратегического подхода и способности адаптироваться к угрозам в реальном времени, что повышает уровень безопасности и производительность систем. Это имеет потенциал для улучшения эффективности и стабильности в работе киберфизических систем.
## Выводы
Результаты показали, что использование мульти-агентного глубокого обучения эффективно для применения в киберфизических системах, улучша
Abstract
The increasing reliance on cyber physical infrastructure in modern power
systems has amplified the risk of targeted cyber attacks, necessitating robust
and adaptive resilience strategies. This paper presents a mathematically
rigorous game theoretic framework to evaluate and enhance microgrid resilience
using a combination of quantitative resilience metrics Load Served Ratio LSR,
Critical Load Resilience CLR, Topological Survivability Score TSS, and DER
Resilience Score DRS. These are integrated into a unified payoff matrix using
the Analytic Hierarchy Process AHP to assess attack defense interactions. The
framework is formalized as a finite horizon Markov Decision Process MDP with
formal convergence guarantees and computational complexity bounds. Three case
studies are developed 1. static attacks analyzed via Nash equilibrium, 2.
severe attacks incorporating high impact strategies, and 3. adaptive attacks
using Stackelberg games, regret matching, softmax heuristics, and Multi Agent Q
Learning. Rigorous theoretical analysis provides convergence proofs with
explicit rates , PAC learning sample complexity bounds, and computational
complexity analysis. The framework is tested on an enhanced IEEE 33bus
distribution system with DERs and control switches, demonstrating the
effectiveness of adaptive and strategic defenses in improving cyber physical
resilience with statistically significant improvements of 18.7% 2.1% over
static approaches.