Leveraging Deep Learning for Physical Model Bias of Global Air Quality Estimates

2508.04886v1 cs.LG, cs.AI 2025-08-09

Авторы:

Kelsey Doerksen, Yuliya Marchetti, Kevin Bowman, Steven Lu, James Montgomery, Yarin Gal, Freddie Kalaitzis, Kazuyuki Miyazaki

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Атмосферный озон является ключевым загрязняющим веществом, которое негативно воздействует на здоровье человека и экологические системы. Он является одной из главных причин преждевременной смертности, причем в 2019 году ассоциировано более 6 млн преждевременных смертей. Несмотря на развитие физико-базированных моделей, таких как MOMO-Chem, моделирование поверхностного озона на масштабах, критичных для здоровья человека, остается сложной задачей. Основная проблема заключается в неизвестных факторах, влияющих на тренды концентрации озона, особенно в урбанизированных регионах. Традиционные модели часто не могут точно предсказывать резидуальные отклонения (bias), что ограничивает их практическую ценность для разработки экологической политики. Мотивацией данного исследования является необходимость создания более точных методов оценки поверхностного озона, которые могли бы компенсировать недостатки физико-базированных моделей. Использование методологий машинного обучения, в том числе глубокого обучения, предлагает перспективы для точного анализа и коррекции bias, особенно при интеграции высокоразрешенных данных, таких как спутниковые изображения. Целью данной работы является исследование возможностей 2D-конволюционных нейронных сетей (CNN) для улучшения оценки поверхностного озона путем моделирования резидуальных отклонений физико-базированных моделей. ## ПРЕДЛОЖЕННЫЙ МЕТОД Исследователи предлагают архитектуру на основе 2D-конволюционных нейронных сетей для моделирования резидуальных отклонений (bias) модели MOMO-Chem. Эта архитектура разработана для анализа пространственных данных и учитывает сложные взаимосвязи между различными факторами, влияющими на концентрацию озона. Ключевой аспект метода — интеграция данных о землепользовании, полученных из высокоразрешенных спутниковых изображений, что позволяет улучшить точность моделирования. Метод включает в себя следующие этапы: 1. **Предобработка данных**: Сбор и нормализация данных о концентрации озона, а также дополнительные данные о землепользовании и других факторах. 2. **Архитектура модели**: 2D CNN используется для анализа двумерных пространственных данных. Архитектура оптимизирована для выявления сложных закономерностей в пространственных шаблонах bias. 3. **Обучение модели**: Использование данных из регионов Северной Америки и Европы для обучения модели. Используются резидуальные отклонения между наблюдаемыми и моделируемыми значениями озона. 4. **Валидация и тестирование**: Модель проверяется на независимых данных для оценки ее точности и общей эффективности. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Исследование проведено на данных из Северной Америки и Европы, где концентрация поверхностного озона была измерена с высокой пространственной и временной разрешенностью. Модель CNN показала значительно лучшие результаты по сравнению с традиционными методами машинного обучения. Использование спутниковых данных о землепользовании значительно улучшило качество прогнозов, особенно в урбанизированных районах. Ключевые показатели эффективности: - **Снижение bias**: Модель CNN уменьшила среднеквадратическую ошибку (RMSE) резидуальных отклонений по сравнению с базовыми подходами. - **Важность данных о землепользовании**: Добавление высокоразрешенных данных улучшило прогнозы, особенно в регионах с высокой динамикой антропогенных изменений. - **Пространственная точность**: Модель лучше представляет пространственные шаблоны bias в урбанизированных и промышленных зонах. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Разработанный метод имеет широкие применимости для улучшения мониторинга качества воздуха и разработки экологической политики. Точная оценка поверхностного озона может помочь в: - **Прогнозировании рисков для здоровья**: Улучшенные модели позволяют более точно оценивать риски, связанные с высокими концентрациями озона. - **Улучшение экологической политики**: Данные, полученные с помощью CNN, могут быть использованы для разработки более эффективных стратегий по снижению загрязнения воздуха. - **Научное понимание**: Исследование помогает выявить факторы, влияющие на bias в моделях, что может привести к улучшению физико-базированных моделей в будущем. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Данное исследование демонстрирует успешное применение глубокого обучения для коррекции bias в моделях поверхностного озона. Использование 2D CNN с высокоразрешенными данными о землепользовании показало высокую эффективность в регионах Северной Америки и Европы. В будущем, данный подход может быть расширен на другие регионы и загрязняющие вещества, что открывает новые возможности для мониторинга и управления качеством воздуха. Дальнейшие исследования могут фокусироваться на интеграции дополнительных данных, таких как метеорологические данные, для дальнейшего улучшения точности моделей.

Abstract

Air pollution is the world's largest environmental risk factor for human disease and premature death, resulting in more than 6 million permature deaths in 2019. Currently, there is still a challenge to model one of the most important air pollutants, surface ozone, particularly at scales relevant for human health impacts, with the drivers of global ozone trends at these scales largely unknown, limiting the practical use of physics-based models. We employ a 2D Convolutional Neural Network based architecture that estimate surface ozone MOMO-Chem model residuals, referred to as model bias. We demonstrate the potential of this technique in North America and Europe, highlighting its ability better to capture physical model residuals compared to a traditional machine learning method. We assess the impact of incorporating land use information from high-resolution satellite imagery to improve model estimates. Importantly, we discuss how our results can improve our scientific understanding of the factors impacting ozone bias at urban scales that can be used to improve environmental policy.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Leveraging Deep Learning for Physical Model Bias of Global Air Quality Estimates

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Realizable Abstractions: Near-Optimal Hierarchical Reinforcement Learning

BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training

Навигация