📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Fangjian Zhang, Xiaoyong Zhuge, Wenlan Wang, Haixia Xiao, Yuying Zhu, Siyang Cheng
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Artificial intelligence has advanced quantitative remote sensing, yet its
effectiveness is constrained by imbalanced label distribution. This imbalance
leads conventionally trained models to favor common samples, which in turn
degrades retrieval performance for rare ones. Rainfall retrieval exemplifies
this issue, with performance particularly compromised for heavy rain. This
study proposes Hurdle-Inversion Model Debiasing Learning (IMDL) framework.
Following a divide-and-conquer strategy, imbal...
📄 MoWE : A Mixture of Weather Experts
2025-09-13Авторы:
Dibyajyoti Chakraborty, Romit Maulik, Peter Harrington, Dallas Foster, Mohammad Amin Nabian, Sanjay Choudhry
#### Контекст
Область метеорологии находится в устойчивом развитии, с целью предоставлять точные прогнозы погоды для различных областей применения. Несмотря на недавнюю успешность искусственного интеллекта в повышении точности прогнозов погоды, прогресс в этой области начинает гаснуть. Основной проблемой является необходимость значительных вычислительных ресурсов для обучения индивидуальных моделей, а также ограничения в их развитии. Мотивация для этого исследования лежит в развитии новых подходов, позволяющих объединять выгоды множества существующих моделей для повышения эффективности и точности прогноза.
#### Метод
Предлагаемый подход, **Mixture of Weather Experts (MoWE)**, основывается на современных архитектурах Vision Transformer. Он использует гатейнг-сеть для динамического слияния выходов нескольких "экспертных" моделей погоды. Эта сеть учитывает не только входные данные, но также информацию о проблемных зонах и географической локализации. Таким образом, MoWE создает синтезированный прогноз, который синхронизирует вклады каждой модели на каждой точке сетки, производя оптимальный выбор в зависимости от глубины прогноза. Этот подход краткосрочным и длительным прогнозам позволяет избежать проблем с оптимизацией всех моделей.
#### Результаты
Эксперименты проведены на наборах данных последнего поколения, включая **ERA5** и **NCEP CFSv2**. Модель была сравнена с лучшими высокоточными прогнозирующими моделями погоды, такими как **HRES** и **ICON**. MoWE показала снижение **RMSE** до **10%** в прогнозе на два дня по сравнению с лучшей моделью и достигла до 20% лучшего результата по сравнению с простой средней моделей. Этот результат достигнут без дополнительных вычислительных затрат, что демонстрирует эффективность архитектуры MoWE в сжатии информации и её оптимальном использовании.
#### Значимость
Модель MoWE может использоваться в различных областях, таких как земледелие, энергетика и транспорт, где точные прогнозы погоды критичны. Она предлагает высокую эффективность, сочетая в себе выгоды лучших моделей без необходимости их дублирования или полного обучения заново. Это не только экономит вычислительные ресурсы, но и позволяет развивать прогностическую модель, не прибегая к новым моделям или алгоритмам.
#### Выводы
Результаты MoWE показывают, что этот подход является эффективным, экономичным и мощным для повышения точности прогнозов погоды. Будущие исследования будут сфокусированы на расширении модели для длительных прогнозов и её применении в глобальных масштабах. Этот подход может стать ключевым фактором в создании нового стандарта для автоматизированных прогнозов погоды, обеспе
Annotation:
Data-driven weather models have recently achieved state-of-the-art
performance, yet progress has plateaued in recent years. This paper introduces
a Mixture of Experts (MoWE) approach as a novel paradigm to overcome these
limitations, not by creating a new forecaster, but by optimally combining the
outputs of existing models. The MoWE model is trained with significantly lower
computational resources than the individual experts. Our model employs a Vision
Transformer-based gating network that dyna...