A Data-Driven RetinaNet Model for Small Object Detection in Aerial Images

2509.02928v1 cs.CV, cs.LG 2025-09-05
Авторы:

Zhicheng Tang, Jinwen Tang, Yi Shang

Резюме на русском

## Контекст Область исследования анализа аэрофотоснимков широко применяется в различных сферах, таких как экология, строительство, транспорт и безопасность. Однако одной из сложностей в этой области является точное обнаружение малых объектов, таких как машины, пешеходы или животные, которые играют ключевую роль в различных приложениях, таких как мониторинг диких животных, оптимизация транспортного сетки и обеспечение безопасности граждан. Существующие модели часто сталкиваются с проблемами, такими как неэффективность при обнаружении малых объектов, высокие затраты на сбор и тренировку данных, а также недостаточная точность в условиях ограниченных данных. Мотивирует разработку новых моделей, которые могут адресовать эти проблемы и улучшить производительность в области обнаружения малых объектов на аэрофотоснимках. ## Метод Модель DDR-Net, предложенная в данной работе, является расширением модели RetinaNet и включает в себя несколько инновационных техник. Модель использует автоматическое определение оптимальных функциональных пространств и анкоров для улучшения точности обнаружения малых объектов. Для повышения эффективности в условиях ограниченных данных разработана новая техника семплирования данных. Архитектура DDR-Net основана на дийн-глубоких нейронных сетях, что позволяет обеспечить высокую точность при оптимальном использовании ресурсов. Эти методы способствуют более эффективной обработке аэрофотоснимков, даже при условии ограниченного объема тренировочных данных. ## Результаты Наборы данных, использованные в экспериментах, включали различные аэрофотоснимки, в том числе съемки с различных высот и разрешений. Эксперименты показали, что DDR-Net превосходит RetinaNet и другие современные модели в задаче обнаружения малых объектов на аэрофотоснимках. Модель достигла более высокой точности и меньшей ошибки нарушения, даже при небольших объемах тренировочных данных. Это демонстрирует эффективность DDR-Net в условиях ограниченных ресурсов. Также был проведен анализ того, как модель работает в различных сценариях, таких как мониторинг диких животных и оптимизация транспортной системы. ## Значимость Результаты DDR-Net имеют широкие применения в сферах, таких как экология, транспорт, безопасность и археология. Например, модель может быть использована для мониторинга диких животных, трассировки транспортных потоков и оптимизации городских строительных проектов. Благодаря своей высокой точности и эффективности в условиях ограниченных данных, DDR-Net обеспечивает экономию времени и ресурсов в процессе обучения и применения

Abstract

In the realm of aerial imaging, the ability to detect small objects is pivotal for a myriad of applications, encompassing environmental surveillance, urban design, and crisis management. Leveraging RetinaNet, this work unveils DDR-Net: a data-driven, deep-learning model devised to enhance the detection of diminutive objects. DDR-Net introduces novel, data-driven techniques to autonomously ascertain optimal feature maps and anchor estimations, cultivating a tailored and proficient training process while maintaining precision. Additionally, this paper presents an innovative sampling technique to bolster model efficacy under limited data training constraints. The model's enhanced detection capabilities support critical applications including wildlife and habitat monitoring, traffic flow optimization, and public safety improvements through accurate identification of small objects like vehicles and pedestrians. DDR-Net significantly reduces the cost and time required for data collection and training, offering efficient performance even with limited data. Empirical assessments over assorted aerial avian imagery datasets demonstrate that DDR-Net markedly surpasses RetinaNet and alternative contemporary models. These innovations advance current aerial image analysis technologies and promise wide-ranging impacts across multiple sectors including agriculture, security, and archaeology.

Ссылки и действия