RSCC: A Large-Scale Remote Sensing Change Caption Dataset for Disaster Events

2509.01907v1 cs.CV, cs.CL 2025-09-05
Авторы:

Zhenyuan Chen, Chenxi Wang, Ningyu Zhang, Feng Zhang

Резюме на русском

## Контекст Исследования по распознаванию и анализу динамических изменений на земной поверхности с помощью дистанционного зрения играют ключевую роль в мониторинге и прогнозировании различных природных и человеческих катастроф. Однако, существующие данные, используемые в этой области, часто ограничиваются односниппетными изображениями без детальных текстовых описаний. Это ограничение не позволяет эффективно отслеживать и анализировать динамику повреждений, восстановлений и других процессов в результате стихийных бедствий. Для устранения этой проблемы и введения более широкого контекста в распознавание изображений, авторы представляют RSCC — большой датасет, который объединяет пред- и постразвития бедствий, подкрепленный человекоподобными текстовыми описаниями. RSCC позволяет создавать модели, которые не только распознают объекты, но и понимают динамику внесенных изменений. ## Метод RSCC состоит из 62 315 пред- и постразвития изображений, связанных с различными катастрофами, такими как землетрясения, наводнения, пожары и цунами. Каждое изображение сопровождается подробным текстовым описанием, изменениями, отраженными на изображениях. Изображения подбирались с помощью методов машинного обучения и геокодирования для обеспечения точности и соответствия реальным условиям. Методы использовались как для сбора данных, так и для создания связанных с ними текстовых описаний, чтобы обеспечить человекоподобный контекст. Эти методы позволяют широко использовать данные для обучения би-темпоральных моделей, которые могут понять и описать процессы, происходящие во времени. ## Результаты Эксперименты показали, что RSCC эффективно используется для обучения моделей, которые могут выполнять би-темпоральный анализ изображений. Использование человекоподобных текстовых описаний позволяет моделям более точно интерпретировать изменения на изображениях. Данные демонстрируют высокую точность распознавания и оценки временных изменений, что может быть использовано в реальных сценариях мониторинга бедствий. Эти результаты подтверждают значимость RSCC в качестве бенчмарка для развития технологий, которые могут быть применены в системах мониторинга и предупреждения о бедствиях. ## Значимость RSCC может быть применен в различных областях, таких как мониторинг климата, стратегическое планирование в городах, анализ земельного пользования и мониторинг безопасности. Он предоставляет значительные преимущества в сравнении с существующими датасетовыми решениями, в частности — в детализации и полноте описания изменений. Благодаря этому, RSCC может способствовать созданию более точных, понятных и скорострелных моделей для

Abstract

Remote sensing is critical for disaster monitoring, yet existing datasets lack temporal image pairs and detailed textual annotations. While single-snapshot imagery dominates current resources, it fails to capture dynamic disaster impacts over time. To address this gap, we introduce the Remote Sensing Change Caption (RSCC) dataset, a large-scale benchmark comprising 62,315 pre-/post-disaster image pairs (spanning earthquakes, floods, wildfires, and more) paired with rich, human-like change captions. By bridging the temporal and semantic divide in remote sensing data, RSCC enables robust training and evaluation of vision-language models for disaster-aware bi-temporal understanding. Our results highlight RSCC's ability to facilitate detailed disaster-related analysis, paving the way for more accurate, interpretable, and scalable vision-language applications in remote sensing. Code and dataset are available at https://github.com/Bili-Sakura/RSCC.

Ссылки и действия