Robust Belief-State Policy Learning for Quantum Network Routing Under Decoherence and Time-Varying Conditions
2509.08654v1
quant-ph, cs.AI, cs.LG, cs.NI
2025-09-12
Авторы:
Amirhossein Taherpour, Abbas Taherpour, Tamer Khattab
Резюме на русском
## Контекст
В теории графов и телекоммуникационных сетях возникает вопрос о оптимальной организации трафика. Наиболее сложными считаются сети супперкубитной технологии, где необходимо учитывать сложные зависимости между узлами в виде энтангленных квантовых связей. Такие системы характеризуются высокой динамичностью, нестационарностью, влиянием шумов и расслаблением энтангления. Оптимальное управление этими системами требует развития новых алгоритмов управления.
В настоящей работе рассматривается такой подход для управления трафиком в квантовых сетях, сформулированный в сфере машинного обучения. Подход основывается на применении фреймворка Partially Observable Markov Decision Process (POMDP), который позволяет комбинировать агентскую модель решения задач с графовыми структурами для моделирования сетевых связей. Это решение предназначается для решения проблем, связанных с учетом динамики, нестационарности и шума в квантовых сетях.
## Метод
Статья предлагает использовать архитектуру гибридного графового нейронного сети (Graph Neural Network, GNN) с Partially Observable Markov Decision Process (POMDP). Трафик в квантовых сетях описывается в виде графового сетевого пространства, где узлы и связи представляют собой квантовые связи между узлами. На основе этого графа генерируется многомерный вектор, который описывает состояние системы. Такое представление позволяет использовать техники POMDP для расчета доверительных показателей (belief states) и выбора оптимальных маршрутов.
Графовые сети обрабатываются с помощью GNN для построения локальных представлений (embeddings), которые поступают в POMDP-фреймворк для выбора оптимальных маршрутов. Для того чтобы учитывать динамику системы и нестационарность, разработчики используют механизм адаптивного шума, который включает в себя анализ шумового воздействия. Это позволяет значительно повысить точность решений в условиях нестационарности.
## Результаты
На основе проведенных экспериментов показано, что предложенный подход позволяет достичь значительно более высокой точности в трафике квантовых сетей в сравнении с текущими методами. Использованные данные включали модели квантовых сетей с до 100 узлов. Отмечается, что система не только эффективно решает задачи управления трафиком, но и умеет адаптироваться к изменениям во внешних условиях, таким как шум и расслабление энтангления.
Результаты показывают, что система достигает высокой точности в определении маршрутов, что позволяет значительно повысить работу квантовых сетей в условиях нестационарности. Это делается благодаря особенности работы POMDP, которая использует не только текущее
Abstract
This paper presents a feature-based Partially Observable Markov Decision
Process (POMDP) framework for quantum network routing, combining belief-state
planning with Graph Neural Networks (GNNs) to address partial observability,
decoherence, and scalability challenges in dynamic quantum systems. Our
approach encodes complex quantum network dynamics, including entanglement
degradation and time-varying channel noise, into a low-dimensional feature
space, enabling efficient belief updates and scalable policy learning. The core
of our framework is a hybrid GNN-POMDP architecture that processes
graph-structured representations of entangled links to learn routing policies,
coupled with a noise-adaptive mechanism that fuses POMDP belief updates with
GNN outputs for robust decision making. We provide a theoretical analysis
establishing guarantees for belief convergence, policy improvement, and
robustness to noise. Experiments on simulated quantum networks with up to 100
nodes demonstrate significant improvements in routing fidelity and entanglement
delivery rates compared to state-of-the-art baselines, particularly under high
decoherence and nonstationary conditions.