Synesthesia of Machines (SoM)-Based Task-Driven MIMO System for Image Transmission

2509.02031v1 eess.SP, cs.AI 2025-09-05
Авторы:

Sijiang Li, Rongqing Zhang, Xiang Cheng, Jian Tang

Резюме на русском

## Контекст Сети множества кооперативных мобильных агентов в динамических сценариях требуют эффективного и надежного передачи сенсорных данных для обеспечения кооперативного восприятия (CP). Одним из ключевых вопросов является трансляция изображений под неблагоприятными условиями канала. Нейронные сети, основанные на комбинировании источника и канала (JSCC), продемонстрировали свою эффективность в передаче изображений по сравнению с традиционными кодеками в таких условиях. Однако существующие MIMO-JSCC-схемы ограничиваются простыми задачами и аналоговыми системами передачи (DTAT), не достаточно эффективными для обеспечения сложных задач CP в сетях с цифровыми системами MIMO. В этой работе предлагается SoM-MIMO — система, основанная на SoM для цифровых систем MIMO, которая учитывает структурные свойства сетки особенностей для задач восприятия и свойства канала MIMO, обеспечивая более эффективную и надежную передачу изображений. ## Метод SoM-MIMO основывается на идее комбинирования структурных свойств сетки особенностей (как задачи восприятия) с канальными свойствами MIMO (как цифровой системы передачи). Архитектура SoM-MIMO включает в себя нейронные сети, которые адаптируются к канальным условиям, объединяя JSCC с MIMO-системой. Она использует преобразование функциональных признаков изображений и их кодирование в соответствии с характеристиками канала MIMO. Данная система позволяет направлять передачу изображений в соответствии с требованиями задачи восприятия и уменьшать потери в канале. Такой подход позволяет эффективно использовать ресурсы канала, снижая ошибки в передаче и улучшая точность восприятия в сетях мобильных агентов. ## Результаты В экспериментах SoM-MIMO сравнивался с двумя базовыми схемами JSCC в условиях различных уровней SNR. Наш подход показал существенное улучшение средней точности детектирования объектов (mAP) — на 6.30 и 10.48 меньше по сравнению с двумя базовыми схемами, при этом сохраняя одинаковый объем передачи данных. Эти результаты демонстрируют высокую эффективность SoM-MIMO в поддержке сложных задач CP в сетях MIMO, имеющих цифровую систему передачи. Это улучшение достигнуто благодаря учету структурных свойств объектов и специфики канала MIMO, что обеспечивает более надежную передачу данных. ## Значимость Предложенная SoM-MIMO-система имеет широкие перспективы в области кооперативного восприятия в сетях мобильных агентов. Она может быть применена в таких областях, как автоматизированная система управления транспортом, системы поиска и спасения, а также в област

Abstract

To support cooperative perception (CP) of networked mobile agents in dynamic scenarios, the efficient and robust transmission of sensory data is a critical challenge. Deep learning-based joint source-channel coding (JSCC) has demonstrated promising results for image transmission under adverse channel conditions, outperforming traditional rule-based codecs. While recent works have explored to combine JSCC with the widely adopted multiple-input multiple-output (MIMO) technology, these approaches are still limited to the discrete-time analog transmission (DTAT) model and simple tasks. Given the limited performance of existing MIMO JSCC schemes in supporting complex CP tasks for networked mobile agents with digital MIMO communication systems, this paper presents a Synesthesia of Machines (SoM)-based task-driven MIMO system for image transmission, referred to as SoM-MIMO. By leveraging the structural properties of the feature pyramid for perceptual tasks and the channel properties of the closed-loop MIMO communication system, SoM-MIMO enables efficient and robust digital MIMO transmission of images. Experimental results have shown that compared with two JSCC baseline schemes, our approach achieves average mAP improvements of 6.30 and 10.48 across all SNR levels, while maintaining identical communication overhead.

Ссылки и действия