Knowledge Distillation for Variational Quantum Convolutional Neural Networks on Heterogeneous Data

2509.16699v1 quant-ph, cs.LG 2025-09-24
Авторы:

Kai Yu, Binbin Cai, Song Lin

Резюме на русском

В современном распределенном квантовом машинном обучении существенной проблемой является неоднородность клиентских данных и разнообразие локальных моделей, что затрудняет агрегацию глобальной модели. Для решения этой задачи предлагается фреймворк на основе технологии знаний обучения (knowledge distillation) для вариационных квантовых сверточных нейронных сетей (ВКСНН) на неоднородных данных. Данный подход включает механизм оценки числа квантовых гетов, ориентированный на клиентские данные, что позволяет адаптировать ресурсы ВКСНН. Используя оптимизацию частиц для генерации персонализированных моделей, фреймворк объединяет знания клиентов с помощью подхода к знаниям, основанному на смеси железных и мягких меток, используя общую выборку данных. Теоретические исследования подтверждают, что фреймворк воспользуется преимуществами высокомерного представления квантовых систем и снижает коммуникационные затраты. Экспериментальные результаты, проведенные на платформе PennyLane, показали, что агрегированная модель достигает точности, приближающейся к модели, обученной с полной супервизией. Таким образом, предложенный подход эффективно решает проблему неоднородности данных, уменьшает вычислительные затраты и сохраняет высокую точность, делая его применимым для распределенных квантовых систем.

Abstract

Distributed quantum machine learning faces significant challenges due to heterogeneous client data and variations in local model structures, which hinder global model aggregation. To address these challenges, we propose a knowledge distillation framework for variational quantum convolutional neural networks on heterogeneous data. The framework features a quantum gate number estimation mechanism based on client data, which guides the construction of resource-adaptive VQCNN circuits. Particle swarm optimization is employed to efficiently generate personalized quantum models tailored to local data characteristics. During aggregation, a knowledge distillation strategy integrating both soft-label and hard-label supervision consolidates knowledge from heterogeneous clients using a public dataset, forming a global model while avoiding parameter exposure and privacy leakage. Theoretical analysis shows that proposed framework benefits from quantum high-dimensional representation, offering advantages over classical approaches, and minimizes communication by exchanging only model indices and test outputs. Extensive simulations on the PennyLane platform validate the effectiveness of the gate number estimation and distillation-based aggregation. Experimental results demonstrate that the aggregated global model achieves accuracy close to fully supervised centralized training. These results shown that proposed methods can effectively handle heterogeneity, reduce resource consumption, and maintain performance, highlighting its potential for scalable and privacy-preserving distributed quantum learning.

Ссылки и действия