Optimization of Private Semantic Communication Performance: An Uncooperative Covert Communication Method
2508.07586v1
cs.AI, cs.NI
2025-08-13
Авторы:
Wenjing Zhang, Ye Hu, Tao Luo, Zhilong Zhang, Mingzhe Chen
Резюме на русском
## Контекст
В последние годы семантическая связь привлекла внимание в области коммуникаций, так как она способствует лучшему пониманию и обработке информации. Однако существуют значительные проблемы, связанные с защитой личных данных и конфиденциальностью семантической информации. Для решения этих проблем в статье предлагается исследовать новую модель семантической связи, в которой сервер передает семантическую информацию (значение изображения) пользователю, в то же время защищая ее от попыток проникновения злоумышленников. Злоумышленник стремится вывести оригинальное изображение из передаваемой семантической информации. Чтобы защитить данные от проникновения, в качестве защиты используется дружественный шумодав, который генерирует шум для запутать злоумышленника. Тем не менее, сервер не может координироваться с шумодавом, что затрудняет оптимизацию процесса передачи. Это требует разработки новых методов, которые могут эффективно оптимизировать систему в условиях ограниченных ресурсов и без двусторонней связи.
## Метод
В статье предлагается методология, основанная на модели удержания дохода (prioritized sampling). Метод сочетает в себе две независимые сети Q, что позволяет избежать локального оптимума и повысить точность оценки Q-значений. Для решения задачи оптимизации системы семантической связи предлагается использовать алгоритм twin delayed deep deterministic policy gradient (TD3). Алгоритм учитывает ограничения на передачу и связь между сервером и шумодавом, оптимизируя семантическую информацию и мощность передачи в каждый отдельный момент времени. Это позволяет уменьшить риск детектирования злоумышленником и повысить качество передачи.
## Результаты
В ходе экспериментов были проанализированы различные сценарии с использованием разных уровней шума и ограничений на передачу. Было проверено, что алгоритм TD3 позволяет значительно повысить степень защиты семантической информации, снизив риск ее детектирования до 32,2% по сравнению с стандартными методами. Кроме того, улучшенный алгоритм повысил качество передачи семантической информации до 14,3% по сравнению с другими методами оптимизации. Эти результаты показывают, что предложенный подход эффективнее в защите конфиденциальности данных и повышении качества передачи семантической информации.
## Значимость
Предлагаемый подход может быть применен в различных сферах, где требуется защита конфиденциальной информации, таких как банковские системы, медицина, интернет вещей. Наибольшее преимущество от использования этого метода могут получить системы с высокими требования
Abstract
In this paper, a novel covert semantic communication framework is
investigated. Within this framework, a server extracts and transmits the
semantic information, i.e., the meaning of image data, to a user over several
time slots. An attacker seeks to detect and eavesdrop the semantic transmission
to acquire details of the original image. To avoid data meaning being
eavesdropped by an attacker, a friendly jammer is deployed to transmit jamming
signals to interfere the attacker so as to hide the transmitted semantic
information. Meanwhile, the server will strategically select time slots for
semantic information transmission. Due to limited energy, the jammer will not
communicate with the server and hence the server does not know the transmit
power of the jammer. Therefore, the server must jointly optimize the semantic
information transmitted at each time slot and the corresponding transmit power
to maximize the privacy and the semantic information transmission quality of
the user. To solve this problem, we propose a prioritised sampling assisted
twin delayed deep deterministic policy gradient algorithm to jointly determine
the transmitted semantic information and the transmit power per time slot
without the communications between the server and the jammer. Compared to
standard reinforcement learning methods, the propose method uses an additional
Q network to estimate Q values such that the agent can select the action with a
lower Q value from the two Q networks thus avoiding local optimal action
selection and estimation bias of Q values. Simulation results show that the
proposed algorithm can improve the privacy and the semantic information
transmission quality by up to 77.8% and 14.3% compared to the traditional
reinforcement learning methods.
Ссылки и действия
Дополнительные ресурсы: