Are All Marine Species Created Equal? Performance Disparities in Underwater Object Detection

2508.18729v1 cs.CV, cs.LG, cs.RO 2025-08-28

Авторы:

Melanie Wille, Tobias Fischer, Scarlett Raine

Резюме на русском

#### Контекст Подводное обнаружение объектов является критически важным для мониторинга мелких и больших водных ландшафтов, которые включают в себя разнообразные технологии, от сдавленных труб в океане до трассировки активности морских животных. Однако эта область сталкивается с рядом уникальных проблем, включая высокий уровень неоднородности визуальных признаков, небольшие размеры выборок для каждого класса и сильное распределение классов. Несмотря на то, что подводное обнаружение объектов является общей задачей, не все виды животных обнаружаются с одинаковой эффективностью. Это приводит к неравенству в поддержке водных животных, что может повлиять на эффективность в целом. Данное исследование определяет, что влияют на эти различия, и ищет способы улучшения обнаружения подводных объектов, которые сейчас работают неэффективно. #### Метод Для разбора проблемы использован датасет DUO, который был разделен на две части: локализация и классификация. Использованы стандартные методы, такие как YOLOv11 и TIDE, чтобы определить проблемы с локализацией. Для классификации были проведены эксперименты, включая новые апробации ситуаций, когда данные были балансированы и распределены. Затем была проанализирована задача обнаружения класса «скаллóп» (черепахи) в DUO-датасете, чтобы выявить причины неэффективной работы модели. Было найдено, что основной проблемой является затрудненная дискриминация фонового шума и визуальных признаков. Для улучшения задачи классификации использовались балансированные данные, чтобы улучшить качество обнаружения. #### Результаты В результате исследования было выявлено, что скевенные распределения данных приводят к разным показателям точности обнаружения в зависимости от класса. Было обнаружено, что операции локализации являются самым трудным этапом, в то время как классификация становится проще, когда данные балансируются. Было также выявлено, что некоторые классы, такие как «скаллóп», остаются сквозными проблемами, даже при балансированных данных. Это вызвано тем, что модели не могут адекватно различать объекты, требуя более глубокого анализа возможностей алгоритмов локализации. #### Значимость Результаты могут быть применены в различных областях, таких как мониторинг малоизвестных видов морских животных, а также для проверки гипотез о взаимосвязи количества данных и устойчивости обнаружения в подводной среде. Этот подход может привести к выявлению новых алгоритмов и методов обучения, которые позволят решать проблему неодинакового обнаружения водных животных. Это также может по

Abstract

Underwater object detection is critical for monitoring marine ecosystems but poses unique challenges, including degraded image quality, imbalanced class distribution, and distinct visual characteristics. Not every species is detected equally well, yet underlying causes remain unclear. We address two key research questions: 1) What factors beyond data quantity drive class-specific performance disparities? 2) How can we systematically improve detection of under-performing marine species? We manipulate the DUO dataset to separate the object detection task into localization and classification and investigate the under-performance of the scallop class. Localization analysis using YOLO11 and TIDE finds that foreground-background discrimination is the most problematic stage regardless of data quantity. Classification experiments reveal persistent precision gaps even with balanced data, indicating intrinsic feature-based challenges beyond data scarcity and inter-class dependencies. We recommend imbalanced distributions when prioritizing precision, and balanced distributions when prioritizing recall. Improving under-performing classes should focus on algorithmic advances, especially within localization modules. We publicly release our code and datasets.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Are All Marine Species Created Equal? Performance Disparities in Underwater Object Detection

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MM-ACT: Learn from Multimodal Parallel Generation to Act

Flux4D: Flow-based Unsupervised 4D Reconstruction

Fast Post-Hoc Confidence Fusion for 3-Class Open-Set Aerial Object Detection

M2H: Multi-Task Learning with Efficient Window-Based Cross-Task Attention for Mo...

CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in Latent W...

Навигация