Multimodal Remote Inference

2508.07555v1 cs.LG, cs.IT, cs.NI, math.IT 2025-08-13
Авторы:

Keyuan Zhang, Yin Sun, Bo Ji

Резюме на русском

## Контекст В современной информационной среде становится все более важной задачей усовершенствования систем, осуществляющих реального времени вывод на основе многомодальных данных. Такие системы применяются в различных областях, включая медицину, промышленность и домашние роботы. Несмотря на потенциал многомодальных моделей машинного обучения (ML), одним из главных ограничений является ограниченность сетевых ресурсов, что создает проблему своевременного доставки данных с различных модалей в модель для расчета. Таким образом, возникает задача оптимизации системы, связанная с сокращением ошибок вывода многомодальной модели, что требует новых методологических подходов. ## Метод Для решения этой задачи предложен запланированный подход, основанный на индексных функциях, который минимизирует ошибки вывода многомодальной модели машинного обучения. Методология включает в себя разработку эффективной стратегии для выбора модальности в любой момент времени на основе индекса функции. Индекс функции рассчитывается на основе статистики задержек и возрастания Age-of-Information (AoI) для каждой модальности. Архитектура решения позволяет гибко адаптироваться к различным типам модальностей и условиям сетевого подключения. ## Результаты Для оценки эффективности предложенного подхода проведены эксперименты с использованием синтетических и реальных данных. Обучалась многомодальная модель машинного обучения для решения задачи реального времени, используя данные с разных сенсоров. Результаты показывают, что индексная политика снижает ошибку вывода до 55% по сравнению с системами, не учитывающими значения Age-of-Information. Эксперименты проводились с различными типами модальностей и разными условиями сетевого подключения, чтобы продемонстрировать гибкость предложенного подхода. ## Значимость Предложенный подход может быть применен в различных областях, где важна свежесть данных для принятия решений, таких как телемедицина, робототехника и мониторинг инфраструктуры. Он предоставляет преимущества в виде улучшения точности решений, оптимизации использования сетевых ресурсов и уменьшения задержек. Благодаря оптимальной стратегии, разработанной в рамках этой работы, можно достичь значительного повышения производительности в условиях ограниченных сетевых ресурсов. ## Выводы Разработанная методология позволяет значительно повысить точность вывода многомодальных моделей машинного обучения в условиях ограниченных сетевых ресурсов. Открываются новые перспективы для исследований в области оптимизации систем реального времени с высокой степенью свежести данных. Будущие исследования будут сфокусирова

Abstract

We consider a remote inference system with multiple modalities, where a multimodal machine learning (ML) model performs real-time inference using features collected from remote sensors. As sensor observations may change dynamically over time, fresh features are critical for inference tasks. However, timely delivering features from all modalities is often infeasible due to limited network resources. To this end, we study a two-modality scheduling problem to minimize the ML model's inference error, which is expressed as a penalty function of AoI for both modalities. We develop an index-based threshold policy and prove its optimality. Specifically, the scheduler switches modalities when the current modality's index function exceeds a threshold. We show that the two modalities share the same threshold, and both the index functions and the threshold can be computed efficiently. The optimality of our policy holds for (i) general AoI functions that are \emph{non-monotonic} and \emph{non-additive} and (ii) \emph{heterogeneous} transmission times. Numerical results show that our policy reduces inference error by up to 55% compared to round-robin and uniform random policies, which are oblivious to the AoI-based inference error function. Our results shed light on how to improve remote inference accuracy by optimizing task-oriented AoI functions.

Ссылки и действия

Связанные статьи

Cost-Free Personalization via Information-Geometric Projection in Bayesian Feder...

## Контекст Байесовская федеративная обучение (BFL) — это метод, который объединяет моделирование неопределенности с дец...

2025-09-16