TerraMAE: Learning Spatial-Spectral Representations from Hyperspectral Earth Observation Data via Adaptive Masked Autoencoders

2508.07020v1 cs.CV, cs.LG 2025-08-13

Авторы:

Tanjim Bin Faruk, Abdul Matin, Shrideep Pallickara, Sangmi Lee Pallickara

Резюме на русском

## Контекст Hyperspectral satellite imagery представляет собой мощный источник данных для тонкого картирования земных покровов и почв, включая подробные анализы растительности и почвенных свойств. Однако использование современных методов машинного обучения для обработки данных, содержащих 200+ спектральных банд, сталкивается с рядом проблем. Традиционные подходы, ориентированные на RGB и многоканальные данные, неэффективно используют геоспациальные корреляции. Это приводит к потере информации и недостаточной точности в решении задач, таких как классификация почв и земных покровов. Необходимо разработать специальную методологию, которая могла бы эффективно обрабатывать этот тип данных, учитывая его уникальные характеристики. ## Метод TerraMAE представляет собой современную архитектуру, основанную на Masked Autoencoders, с усовершенствованными методами адаптивной группировки каналов. Основная идея заключается в группировке спектральных банд по статистическим свойствам отражаемости, чтобы сохранять корреляции между бандами. Для повышения точности реконструкции используется усовершенствованная функция потерь, которая учитывает как спектральную, так и пространственную точность. Таким образом, TerraMAE не только сохраняет корреляции между спектральными каналами, но также улучшает представимость пространственной информации. Это позволяет получать высококачественные представления для дальнейшего использования в геоспациальных задачах. ## Результаты Использовавшимися данными стали наборы данных hyperspectral imagery, которые охватывают различные географические регионы. В результате использования TerraMAE были получены реконструкции с высокой точностью, улучшенной представимостью спектрально-пространственных свойств. Эксперименты показали, что TerraMAE превосходит существующие подходы в задачах, таких как crop identification (классификация растений), land cover classification (классификация земных покровов) и soil texture prediction (предсказание текстуры почвы). Эти результаты подтверждают эффективность TerraMAE в получении уникальных представлений для разнообразных геоспациальных задач. ## Значимость Результаты TerraMAE могут быть применены в различных областях, включая агрономию, экологию и картографию. Особым преимуществом является улучшенная точность в задачах классификации и предсказания, что может способствовать более эффективному управлению землями и ресурсами. Особенно полезными являются эти достижения в условиях малого количества меток, где современные методы часто сталкиваются с ограничениями. Будущие исследования будут нацелены на расширение применимости TerraMAE к другим типам спутниковых данных и улучшение качест

Abstract

Hyperspectral satellite imagery offers sub-30 m views of Earth in hundreds of contiguous spectral bands, enabling fine-grained mapping of soils, crops, and land cover. While self-supervised Masked Autoencoders excel on RGB and low-band multispectral data, they struggle to exploit the intricate spatial-spectral correlations in 200+ band hyperspectral images. We introduce TerraMAE, a novel HSI encoding framework specifically designed to learn highly representative spatial-spectral embeddings for diverse geospatial analyses. TerraMAE features an adaptive channel grouping strategy, based on statistical reflectance properties to capture spectral similarities, and an enhanced reconstruction loss function that incorporates spatial and spectral quality metrics. We demonstrate TerraMAE's effectiveness through superior spatial-spectral information preservation in high-fidelity image reconstruction. Furthermore, we validate its practical utility and the quality of its learned representations through strong performance on three key downstream geospatial tasks: crop identification, land cover classification, and soil texture prediction.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

TerraMAE: Learning Spatial-Spectral Representations from Hyperspectral Earth Observation Data via Adaptive Masked Autoencoders

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Plug-and-Play Image Restoration with Flow Matching: A Continuous Viewpoint

Inference-time Stochastic Refinement of GRU-Normalizing Flow for Real-time Video...

Rethinking the Use of Vision Transformers for AI-Generated Image Detection

Aligned but Stereotypical? The Hidden Influence of System Prompts on Social Bias...

HTR-ConvText: Leveraging Convolution and Textual Information for Handwritten Tex...

Навигация