Large-Scale Model Enabled Semantic Communication Based on Robust Knowledge Distillation

2508.02148v1 cs.LG, cs.AI, eess.IV, eess.SP 2025-08-09

Авторы:

Kuiyuan DIng, Caili Guo, Yang Yang, Zhongtian Du, Walid Saad

Резюме на русском

#### Контекст Проектирование систем семантической связи (SC) требует эффективных методов представления и понимания семантики. Большие модели языка (Large-Scale Models, LSMs) показали высокую эффективность в этой области, но их применение в SC ограничено высоким ресурсоемкостью и высокой чувствительностью к шумам канала. Эти проблемы напрягают требования к эффективности и надёжности, которые становятся ключевыми мотивациями для исследований в этой области. #### Метод Предлагается новый фреймворк RKD-SC (Robust Knowledge Distillation for Semantic Communication), который объединяет продвинутую архитектуру поиска светлой модели и два этапа значительного знакомого тренирования. Алгоритм KDL-DARTS используется для поиска оптимальной, светлой структуры модели с помощью интеграции значения знакового потери и критерия хронической сложности. Второй этап, RKD, предназначен для передачи семантических способностей из большой модели (учитель) в легкую модель (ученик) с помощью знакового доступа под разными условиями канала. Для улучшения устойчивости к шумам канала вводится трансформер канала (CAT), который учится с различными длинами выхода и при сильных шумах канала. #### Результаты Проведены симуляции на задачах классификации изображений. Результаты показали, что RKD-SC значительно сокращает число параметров модели, сохраняя высокую эффективность исходной модели и превосходящую устойчивость к шумам канала по сравнению с другими подходами. Это достигнуто благодаря легковесной архитектуре и надежному знаковому доступу. #### Значимость Предложенный подход может быть применён в различных семантических системах связи, в том числе в системах с видео- и звуковым анализом. Он обеспечивает увеличение эффективности за счёт снижения ресурсоемкости и повышает надёжность в неблагоприятных условиях канала. Это значительно повышает потенциал SC в прикладных областях, таких как умные города, транспортные системы и здравоохранение. #### Выводы Разработанный фреймворк RKD-SC доказал свою эффективность в создании светлых моделей с помощью знакового доступа, обеспечивая высокую устойчивость к шумам канала и сохраняя высокую семантическую точность. Будущие исследования будут направлены на расширение этого подхода для работы со сложными сценариями и добиваться более высокой эффективности в реальных системах SC.

Abstract

Large-scale models (LSMs) can be an effective framework for semantic representation and understanding, thereby providing a suitable tool for designing semantic communication (SC) systems. However, their direct deployment is often hindered by high computational complexity and resource requirements. In this paper, a novel robust knowledge distillation based semantic communication (RKD-SC) framework is proposed to enable efficient and \textcolor{black}{channel-noise-robust} LSM-powered SC. The framework addresses two key challenges: determining optimal compact model architectures and effectively transferring knowledge while maintaining robustness against channel noise. First, a knowledge distillation-based lightweight differentiable architecture search (KDL-DARTS) algorithm is proposed. This algorithm integrates knowledge distillation loss and a complexity penalty into the neural architecture search process to identify high-performance, lightweight semantic encoder architectures. Second, a novel two-stage robust knowledge distillation (RKD) algorithm is developed to transfer semantic capabilities from an LSM (teacher) to a compact encoder (student) and subsequently enhance system robustness. To further improve resilience to channel impairments, a channel-aware transformer (CAT) block is introduced as the channel codec, trained under diverse channel conditions with variable-length outputs. Extensive simulations on image classification tasks demonstrate that the RKD-SC framework significantly reduces model parameters while preserving a high degree of the teacher model's performance and exhibiting superior robustness compared to existing methods.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация