RSCC: A Large-Scale Remote Sensing Change Caption Dataset for Disaster Events
2509.01907v1
cs.CV, cs.CL
2025-09-05
Авторы:
Zhenyuan Chen, Chenxi Wang, Ningyu Zhang, Feng Zhang
Резюме на русском
## Контекст
Исследования по распознаванию и анализу динамических изменений на земной поверхности с помощью дистанционного зрения играют ключевую роль в мониторинге и прогнозировании различных природных и человеческих катастроф. Однако, существующие данные, используемые в этой области, часто ограничиваются односниппетными изображениями без детальных текстовых описаний. Это ограничение не позволяет эффективно отслеживать и анализировать динамику повреждений, восстановлений и других процессов в результате стихийных бедствий. Для устранения этой проблемы и введения более широкого контекста в распознавание изображений, авторы представляют RSCC — большой датасет, который объединяет пред- и постразвития бедствий, подкрепленный человекоподобными текстовыми описаниями. RSCC позволяет создавать модели, которые не только распознают объекты, но и понимают динамику внесенных изменений.
## Метод
RSCC состоит из 62 315 пред- и постразвития изображений, связанных с различными катастрофами, такими как землетрясения, наводнения, пожары и цунами. Каждое изображение сопровождается подробным текстовым описанием, изменениями, отраженными на изображениях. Изображения подбирались с помощью методов машинного обучения и геокодирования для обеспечения точности и соответствия реальным условиям. Методы использовались как для сбора данных, так и для создания связанных с ними текстовых описаний, чтобы обеспечить человекоподобный контекст. Эти методы позволяют широко использовать данные для обучения би-темпоральных моделей, которые могут понять и описать процессы, происходящие во времени.
## Результаты
Эксперименты показали, что RSCC эффективно используется для обучения моделей, которые могут выполнять би-темпоральный анализ изображений. Использование человекоподобных текстовых описаний позволяет моделям более точно интерпретировать изменения на изображениях. Данные демонстрируют высокую точность распознавания и оценки временных изменений, что может быть использовано в реальных сценариях мониторинга бедствий. Эти результаты подтверждают значимость RSCC в качестве бенчмарка для развития технологий, которые могут быть применены в системах мониторинга и предупреждения о бедствиях.
## Значимость
RSCC может быть применен в различных областях, таких как мониторинг климата, стратегическое планирование в городах, анализ земельного пользования и мониторинг безопасности. Он предоставляет значительные преимущества в сравнении с существующими датасетовыми решениями, в частности — в детализации и полноте описания изменений. Благодаря этому, RSCC может способствовать созданию более точных, понятных и скорострелных моделей для
Abstract
Remote sensing is critical for disaster monitoring, yet existing datasets
lack temporal image pairs and detailed textual annotations. While
single-snapshot imagery dominates current resources, it fails to capture
dynamic disaster impacts over time. To address this gap, we introduce the
Remote Sensing Change Caption (RSCC) dataset, a large-scale benchmark
comprising 62,315 pre-/post-disaster image pairs (spanning earthquakes, floods,
wildfires, and more) paired with rich, human-like change captions. By bridging
the temporal and semantic divide in remote sensing data, RSCC enables robust
training and evaluation of vision-language models for disaster-aware
bi-temporal understanding. Our results highlight RSCC's ability to facilitate
detailed disaster-related analysis, paving the way for more accurate,
interpretable, and scalable vision-language applications in remote sensing.
Code and dataset are available at https://github.com/Bili-Sakura/RSCC.
Ссылки и действия
Дополнительные ресурсы: