TerraMAE: Learning Spatial-Spectral Representations from Hyperspectral Earth Observation Data via Adaptive Masked Autoencoders
2508.07020v1
cs.CV, cs.LG
2025-08-13
Авторы:
Tanjim Bin Faruk, Abdul Matin, Shrideep Pallickara, Sangmi Lee Pallickara
Резюме на русском
## Контекст
Hyperspectral satellite imagery представляет собой мощный источник данных для тонкого картирования земных покровов и почв, включая подробные анализы растительности и почвенных свойств. Однако использование современных методов машинного обучения для обработки данных, содержащих 200+ спектральных банд, сталкивается с рядом проблем. Традиционные подходы, ориентированные на RGB и многоканальные данные, неэффективно используют геоспациальные корреляции. Это приводит к потере информации и недостаточной точности в решении задач, таких как классификация почв и земных покровов. Необходимо разработать специальную методологию, которая могла бы эффективно обрабатывать этот тип данных, учитывая его уникальные характеристики.
## Метод
TerraMAE представляет собой современную архитектуру, основанную на Masked Autoencoders, с усовершенствованными методами адаптивной группировки каналов. Основная идея заключается в группировке спектральных банд по статистическим свойствам отражаемости, чтобы сохранять корреляции между бандами. Для повышения точности реконструкции используется усовершенствованная функция потерь, которая учитывает как спектральную, так и пространственную точность. Таким образом, TerraMAE не только сохраняет корреляции между спектральными каналами, но также улучшает представимость пространственной информации. Это позволяет получать высококачественные представления для дальнейшего использования в геоспациальных задачах.
## Результаты
Использовавшимися данными стали наборы данных hyperspectral imagery, которые охватывают различные географические регионы. В результате использования TerraMAE были получены реконструкции с высокой точностью, улучшенной представимостью спектрально-пространственных свойств. Эксперименты показали, что TerraMAE превосходит существующие подходы в задачах, таких как crop identification (классификация растений), land cover classification (классификация земных покровов) и soil texture prediction (предсказание текстуры почвы). Эти результаты подтверждают эффективность TerraMAE в получении уникальных представлений для разнообразных геоспациальных задач.
## Значимость
Результаты TerraMAE могут быть применены в различных областях, включая агрономию, экологию и картографию. Особым преимуществом является улучшенная точность в задачах классификации и предсказания, что может способствовать более эффективному управлению землями и ресурсами. Особенно полезными являются эти достижения в условиях малого количества меток, где современные методы часто сталкиваются с ограничениями. Будущие исследования будут нацелены на расширение применимости TerraMAE к другим типам спутниковых данных и улучшение качест
Abstract
Hyperspectral satellite imagery offers sub-30 m views of Earth in hundreds of
contiguous spectral bands, enabling fine-grained mapping of soils, crops, and
land cover. While self-supervised Masked Autoencoders excel on RGB and low-band
multispectral data, they struggle to exploit the intricate spatial-spectral
correlations in 200+ band hyperspectral images. We introduce TerraMAE, a novel
HSI encoding framework specifically designed to learn highly representative
spatial-spectral embeddings for diverse geospatial analyses. TerraMAE features
an adaptive channel grouping strategy, based on statistical reflectance
properties to capture spectral similarities, and an enhanced reconstruction
loss function that incorporates spatial and spectral quality metrics. We
demonstrate TerraMAE's effectiveness through superior spatial-spectral
information preservation in high-fidelity image reconstruction. Furthermore, we
validate its practical utility and the quality of its learned representations
through strong performance on three key downstream geospatial tasks: crop
identification, land cover classification, and soil texture prediction.
Ссылки и действия
Дополнительные ресурсы: