Knowledge Distillation for Variational Quantum Convolutional Neural Networks on Heterogeneous Data
2509.16699v1
quant-ph, cs.LG
2025-09-24
Авторы:
Kai Yu, Binbin Cai, Song Lin
Резюме на русском
В современном распределенном квантовом машинном обучении существенной проблемой является неоднородность клиентских данных и разнообразие локальных моделей, что затрудняет агрегацию глобальной модели. Для решения этой задачи предлагается фреймворк на основе технологии знаний обучения (knowledge distillation) для вариационных квантовых сверточных нейронных сетей (ВКСНН) на неоднородных данных. Данный подход включает механизм оценки числа квантовых гетов, ориентированный на клиентские данные, что позволяет адаптировать ресурсы ВКСНН. Используя оптимизацию частиц для генерации персонализированных моделей, фреймворк объединяет знания клиентов с помощью подхода к знаниям, основанному на смеси железных и мягких меток, используя общую выборку данных. Теоретические исследования подтверждают, что фреймворк воспользуется преимуществами высокомерного представления квантовых систем и снижает коммуникационные затраты. Экспериментальные результаты, проведенные на платформе PennyLane, показали, что агрегированная модель достигает точности, приближающейся к модели, обученной с полной супервизией. Таким образом, предложенный подход эффективно решает проблему неоднородности данных, уменьшает вычислительные затраты и сохраняет высокую точность, делая его применимым для распределенных квантовых систем.
Abstract
Distributed quantum machine learning faces significant challenges due to
heterogeneous client data and variations in local model structures, which
hinder global model aggregation. To address these challenges, we propose a
knowledge distillation framework for variational quantum convolutional neural
networks on heterogeneous data. The framework features a quantum gate number
estimation mechanism based on client data, which guides the construction of
resource-adaptive VQCNN circuits. Particle swarm optimization is employed to
efficiently generate personalized quantum models tailored to local data
characteristics. During aggregation, a knowledge distillation strategy
integrating both soft-label and hard-label supervision consolidates knowledge
from heterogeneous clients using a public dataset, forming a global model while
avoiding parameter exposure and privacy leakage. Theoretical analysis shows
that proposed framework benefits from quantum high-dimensional representation,
offering advantages over classical approaches, and minimizes communication by
exchanging only model indices and test outputs. Extensive simulations on the
PennyLane platform validate the effectiveness of the gate number estimation and
distillation-based aggregation. Experimental results demonstrate that the
aggregated global model achieves accuracy close to fully supervised centralized
training. These results shown that proposed methods can effectively handle
heterogeneity, reduce resource consumption, and maintain performance,
highlighting its potential for scalable and privacy-preserving distributed
quantum learning.
Ссылки и действия
Дополнительные ресурсы: