Synesthesia of Machines (SoM)-Based Task-Driven MIMO System for Image Transmission
2509.02031v1
eess.SP, cs.AI
2025-09-05
Авторы:
Sijiang Li, Rongqing Zhang, Xiang Cheng, Jian Tang
Резюме на русском
## Контекст
Сети множества кооперативных мобильных агентов в динамических сценариях требуют эффективного и надежного передачи сенсорных данных для обеспечения кооперативного восприятия (CP). Одним из ключевых вопросов является трансляция изображений под неблагоприятными условиями канала. Нейронные сети, основанные на комбинировании источника и канала (JSCC), продемонстрировали свою эффективность в передаче изображений по сравнению с традиционными кодеками в таких условиях. Однако существующие MIMO-JSCC-схемы ограничиваются простыми задачами и аналоговыми системами передачи (DTAT), не достаточно эффективными для обеспечения сложных задач CP в сетях с цифровыми системами MIMO. В этой работе предлагается SoM-MIMO — система, основанная на SoM для цифровых систем MIMO, которая учитывает структурные свойства сетки особенностей для задач восприятия и свойства канала MIMO, обеспечивая более эффективную и надежную передачу изображений.
## Метод
SoM-MIMO основывается на идее комбинирования структурных свойств сетки особенностей (как задачи восприятия) с канальными свойствами MIMO (как цифровой системы передачи). Архитектура SoM-MIMO включает в себя нейронные сети, которые адаптируются к канальным условиям, объединяя JSCC с MIMO-системой. Она использует преобразование функциональных признаков изображений и их кодирование в соответствии с характеристиками канала MIMO. Данная система позволяет направлять передачу изображений в соответствии с требованиями задачи восприятия и уменьшать потери в канале. Такой подход позволяет эффективно использовать ресурсы канала, снижая ошибки в передаче и улучшая точность восприятия в сетях мобильных агентов.
## Результаты
В экспериментах SoM-MIMO сравнивался с двумя базовыми схемами JSCC в условиях различных уровней SNR. Наш подход показал существенное улучшение средней точности детектирования объектов (mAP) — на 6.30 и 10.48 меньше по сравнению с двумя базовыми схемами, при этом сохраняя одинаковый объем передачи данных. Эти результаты демонстрируют высокую эффективность SoM-MIMO в поддержке сложных задач CP в сетях MIMO, имеющих цифровую систему передачи. Это улучшение достигнуто благодаря учету структурных свойств объектов и специфики канала MIMO, что обеспечивает более надежную передачу данных.
## Значимость
Предложенная SoM-MIMO-система имеет широкие перспективы в области кооперативного восприятия в сетях мобильных агентов. Она может быть применена в таких областях, как автоматизированная система управления транспортом, системы поиска и спасения, а также в област
Abstract
To support cooperative perception (CP) of networked mobile agents in dynamic
scenarios, the efficient and robust transmission of sensory data is a critical
challenge. Deep learning-based joint source-channel coding (JSCC) has
demonstrated promising results for image transmission under adverse channel
conditions, outperforming traditional rule-based codecs. While recent works
have explored to combine JSCC with the widely adopted multiple-input
multiple-output (MIMO) technology, these approaches are still limited to the
discrete-time analog transmission (DTAT) model and simple tasks. Given the
limited performance of existing MIMO JSCC schemes in supporting complex CP
tasks for networked mobile agents with digital MIMO communication systems, this
paper presents a Synesthesia of Machines (SoM)-based task-driven MIMO system
for image transmission, referred to as SoM-MIMO. By leveraging the structural
properties of the feature pyramid for perceptual tasks and the channel
properties of the closed-loop MIMO communication system, SoM-MIMO enables
efficient and robust digital MIMO transmission of images. Experimental results
have shown that compared with two JSCC baseline schemes, our approach achieves
average mAP improvements of 6.30 and 10.48 across all SNR levels, while
maintaining identical communication overhead.
Ссылки и действия
Дополнительные ресурсы: