MAESTRO: Multi-modal Adaptive Ensemble for Spectro-Temporal Robust Optimization
2509.08578v1
cs.LG, q-bio.PE, q-bio.QM
2025-09-12
Авторы:
Hong Liu
Резюме на русском
#### Контекст
Прогнозирование инцидентов инфлюенции является ключевым аспектом принятия решений в области общественного здравоохранения. Однако традиционные модели часто сталкиваются с проблемами нестабильности и низкой точностью в условиях неоднородности данных и непредсказуемых внешних факторов. Данная работа нацелена на разработку модели, объединяющей многомодальные данные и высокую степень устойчивости к шумам, для создания более точных и надежных прогнозов.
#### Метод
Модель **MAESTRO** (Multi-modal Adaptive Ensemble for Spectro-Temporal Robust Optimization) представляет собой сложное адаптивное а Eнсембление, объединяющее несколько модальностей данных, включая зоопастные сигналы, поисковые запросы в интернете и метеорологические данные. Работа метода основывается на декомпозиции временных рядов на составляющие — сезонные и трендовые. Далее, данные обрабатываются с использованием гибридного моделирования функций, включающего трансформер-базированные энкодеры, модель состояний Мамба для учета длинных зависимостей, многомерные темпоральные конволюции и анализ в частотном домене. Механизм кросс-канального внимания объединяет входные данные из разных модальностей. Наконец, модель выполняет прогнозирование с помощью подхода сиквела-сиквел, с возможностью оценки неопределенности прогноза.
#### Результаты
На выборке данных по инцидентам инфлюенции в Гонконге за 11-летний период (исключая период COVID-19), MAESTRO достиг среднего R-квадрат 0.956, что является состоянием лидерства в сравнении с другими моделями. Эксперименты показали, что модель показывает высокую устойчивость к шуму и неоднородности данных, а также эффективно интегрирует многомодальные источники. Аблэйтонные эксперименты подтвердили вклад как многомодального подхода, так и компонентов спектро-временной обработки.
#### Значимость
MAESTRO представляет собой мощный инструмент для прогнозирования инцидентов медицинских заболеваний. Его можно применить для различных регионов и заболеваний, предоставив платформу для более точного и надежного здоровьесохранения. Его ключевым преимуществом является возможность разделения сезонных и трендовых компонентов, что позволяет обеспечить точные прогнозы даже при изменении характера внешних факторов.
#### Выводы
Результаты подтверждают высокую эффективность MAESTRO в прогнозировании инцидентов инфлюенции. На основе этого работы могут быть разработаны дальнейшие исследования, направленные на расширение модели для других регионов и типов заболеваний, а также для улучшения ее надёжности в условиях пандемий и крупных сдвигов внешних факторов.
Abstract
Timely and robust influenza incidence forecasting is critical for public
health decision-making. To address this, we present MAESTRO, a Multi-modal
Adaptive Ensemble for Spectro-Temporal Robust Optimization. MAESTRO achieves
robustness by adaptively fusing multi-modal inputs-including surveillance, web
search trends, and meteorological data-and leveraging a comprehensive
spectro-temporal architecture. The model first decomposes time series into
seasonal and trend components. These are then processed through a hybrid
feature enhancement pipeline combining Transformer-based encoders, a Mamba
state-space model for long-range dependencies, multi-scale temporal
convolutions, and a frequency-domain analysis module. A cross-channel attention
mechanism further integrates information across the different data modalities.
Finally, a temporal projection head performs sequence-to-sequence forecasting,
with an optional estimator to quantify prediction uncertainty. Evaluated on
over 11 years of Hong Kong influenza data (excluding the COVID-19 period),
MAESTRO shows strong competitive performance, demonstrating a superior model
fit and relative accuracy, achieving a state-of-the-art R-square of 0.956.
Extensive ablations confirm the significant contributions of both multi-modal
fusion and the spectro-temporal components. Our modular and reproducible
pipeline is made publicly available to facilitate deployment and extension to
other regions and pathogens.Our publicly available pipeline presents a
powerful, unified framework, demonstrating the critical synergy of advanced
spectro-temporal modeling and multi-modal data fusion for robust
epidemiological forecasting.