A Data-Driven RetinaNet Model for Small Object Detection in Aerial Images
2509.02928v1
cs.CV, cs.LG
2025-09-05
Авторы:
Zhicheng Tang, Jinwen Tang, Yi Shang
Резюме на русском
## Контекст
Область исследования анализа аэрофотоснимков широко применяется в различных сферах, таких как экология, строительство, транспорт и безопасность. Однако одной из сложностей в этой области является точное обнаружение малых объектов, таких как машины, пешеходы или животные, которые играют ключевую роль в различных приложениях, таких как мониторинг диких животных, оптимизация транспортного сетки и обеспечение безопасности граждан. Существующие модели часто сталкиваются с проблемами, такими как неэффективность при обнаружении малых объектов, высокие затраты на сбор и тренировку данных, а также недостаточная точность в условиях ограниченных данных. Мотивирует разработку новых моделей, которые могут адресовать эти проблемы и улучшить производительность в области обнаружения малых объектов на аэрофотоснимках.
## Метод
Модель DDR-Net, предложенная в данной работе, является расширением модели RetinaNet и включает в себя несколько инновационных техник. Модель использует автоматическое определение оптимальных функциональных пространств и анкоров для улучшения точности обнаружения малых объектов. Для повышения эффективности в условиях ограниченных данных разработана новая техника семплирования данных. Архитектура DDR-Net основана на дийн-глубоких нейронных сетях, что позволяет обеспечить высокую точность при оптимальном использовании ресурсов. Эти методы способствуют более эффективной обработке аэрофотоснимков, даже при условии ограниченного объема тренировочных данных.
## Результаты
Наборы данных, использованные в экспериментах, включали различные аэрофотоснимки, в том числе съемки с различных высот и разрешений. Эксперименты показали, что DDR-Net превосходит RetinaNet и другие современные модели в задаче обнаружения малых объектов на аэрофотоснимках. Модель достигла более высокой точности и меньшей ошибки нарушения, даже при небольших объемах тренировочных данных. Это демонстрирует эффективность DDR-Net в условиях ограниченных ресурсов. Также был проведен анализ того, как модель работает в различных сценариях, таких как мониторинг диких животных и оптимизация транспортной системы.
## Значимость
Результаты DDR-Net имеют широкие применения в сферах, таких как экология, транспорт, безопасность и археология. Например, модель может быть использована для мониторинга диких животных, трассировки транспортных потоков и оптимизации городских строительных проектов. Благодаря своей высокой точности и эффективности в условиях ограниченных данных, DDR-Net обеспечивает экономию времени и ресурсов в процессе обучения и применения
Abstract
In the realm of aerial imaging, the ability to detect small objects is
pivotal for a myriad of applications, encompassing environmental surveillance,
urban design, and crisis management. Leveraging RetinaNet, this work unveils
DDR-Net: a data-driven, deep-learning model devised to enhance the detection of
diminutive objects. DDR-Net introduces novel, data-driven techniques to
autonomously ascertain optimal feature maps and anchor estimations, cultivating
a tailored and proficient training process while maintaining precision.
Additionally, this paper presents an innovative sampling technique to bolster
model efficacy under limited data training constraints. The model's enhanced
detection capabilities support critical applications including wildlife and
habitat monitoring, traffic flow optimization, and public safety improvements
through accurate identification of small objects like vehicles and pedestrians.
DDR-Net significantly reduces the cost and time required for data collection
and training, offering efficient performance even with limited data. Empirical
assessments over assorted aerial avian imagery datasets demonstrate that
DDR-Net markedly surpasses RetinaNet and alternative contemporary models. These
innovations advance current aerial image analysis technologies and promise
wide-ranging impacts across multiple sectors including agriculture, security,
and archaeology.
Ссылки и действия
Дополнительные ресурсы: