Model-Agnostic Open-Set Air-to-Air Visual Object Detection for Reliable UAV Perception
2509.09297v1
cs.CV, cs.LG, cs.RO
2025-09-13
Авторы:
Spyridon Loukovitis, Anastasios Arsenos, Vasileios Karampinis, Athanasios Voulodimos
Резюме на русском
## Контекст
Управление дронами в реальных условиях требует высокоточного визуального распознавания объектов. Однако существующие системы часто сталкиваются с проблемами, такими как неточность в распознавании неизвестных объектов и неустойчивость при помехах в данных. Эти ограничения могут привести к небезопасным ситуациям в случае применения дронов в критически важных задачах, таких как поиск-спасательные операции или системы безопасности. Для решения этих проблем необходимо развить методы, обеспечивающие надежную детекцию в условиях динамической среды, включая распознавание неизвестных объектов и устойчивость к помехам.
## Метод
Предлагаемый подход является модельно-независимым и специально разработанным для работы с визуальными детекторами, основанными на подходе на основе инкубирующих представлений (embedding-based detectors). Он реализует механизм отклонения неизвестных объектов, используя модель на основе ентропии в пространстве инкубирующих представлений. Для повышения отклика системы при работе с помехами в данных введены спектральная нормализация и температурная масштабирование. Эта архитектура обеспечивает улучшение отклика системы на некоторые семантические изменения в данных, что позволяет лучше отличать искомые объекты от фоновых элементов.
## Результаты
Результаты экспериментов проведены на сложной аэроизображенной выборке AOT и в реальных условиях полета дрона. Метод показал значительное улучшение в отклике на неизвестные объекты с расширенным интервалом вероятности (AUROC), достигая при этом высокой точности в распознавании целевых объектов. Кроме того, добавление функции отсева фоновых элементов способствует дальнейшему повышению устойчивости детектора без ущерба для точности распознавания.
## Значимость
Предлагаемый подход может быть применен в системах автономного управления дронов в задачах поиска-спасения, системах безопасности и других критически важных применениях. Он обеспечивает улучшенную устойчивость к помехам, высокую точность распознавания и гибкость в работе с неизвестными объектами. Эти преимущества позволяют расширить область использования дронов в реальных сценариях, улучшив надежность и безопасность.
## Выводы
Предложенный метод является модельно-независимым и эффективным для улучшения отклика управления дронами в реальных условиях. Результаты показывают преимущества метода над существующими алгоритмами в области отклика на неизвестные объекты и устойчивости к помехам. Будущие исследования будут сконцентрированы на расширении функционала детектора в работе с более
Abstract
Open-set detection is crucial for robust UAV autonomy in air-to-air object
detection under real-world conditions. Traditional closed-set detectors degrade
significantly under domain shifts and flight data corruption, posing risks to
safety-critical applications. We propose a novel, model-agnostic open-set
detection framework designed specifically for embedding-based detectors. The
method explicitly handles unknown object rejection while maintaining robustness
against corrupted flight data. It estimates semantic uncertainty via entropy
modeling in the embedding space and incorporates spectral normalization and
temperature scaling to enhance open-set discrimination. We validate our
approach on the challenging AOT aerial benchmark and through extensive
real-world flight tests. Comprehensive ablation studies demonstrate consistent
improvements over baseline methods, achieving up to a 10\% relative AUROC gain
compared to standard YOLO-based detectors. Additionally, we show that
background rejection further strengthens robustness without compromising
detection accuracy, making our solution particularly well-suited for reliable
UAV perception in dynamic air-to-air environments.
Ссылки и действия
Дополнительные ресурсы: