Learning Using Privileged Information for Litter Detection

2508.04124v1 cs.CV, cs.ET, cs.LG, cs.PF 2025-08-09
Авторы:

Matthias Bartolo, Konstantinos Makantasis, Dylan Seychell

Резюме на русском

Загрязнение мусором, особенно в природных ландшафтах, становится всё более актуальной проблемой в мире. Авторы предлагают новую методику для улучшения автоматизированного обнаружения мусора с помощью свёрточных нейронных сетей. Используется подход **Learning Using Privileged Information (LUPI)**, который впервые комбинирует привилегированные данные с техникой обучения с подкреплением. Данные привилегированные включают дополнительные информационные признаки, такие как области интереса (bounding boxes), которые могут улучшить точность обнаружения мелких предметов и предметов, частично скрытых другими объектами или землей. Эксперименты проводились на широко используемых датасетах SODA, BDW и UAVVaste. Метод достиг стабильных повышений точности обнаружения на всех используемых моделях, не прибегая к усложнению архитектуры и сохраняя высокую эффективность. Это доказательство того, что LUPI может быть эффективно применено в данной области, обеспечивая высокую точность и скорость распознавания.

Abstract

As litter pollution continues to rise globally, developing automated tools capable of detecting litter effectively remains a significant challenge. This study presents a novel approach that combines, for the first time, privileged information with deep learning object detection to improve litter detection while maintaining model efficiency. We evaluate our method across five widely used object detection models, addressing challenges such as detecting small litter and objects partially obscured by grass or stones. In addition to this, a key contribution of our work can also be attributed to formulating a means of encoding bounding box information as a binary mask, which can be fed to the detection model to refine detection guidance. Through experiments on both within-dataset evaluation on the renowned SODA dataset and cross-dataset evaluation on the BDW and UAVVaste litter detection datasets, we demonstrate consistent performance improvements across all models. Our approach not only bolsters detection accuracy within the training sets but also generalises well to other litter detection contexts. Crucially, these improvements are achieved without increasing model complexity or adding extra layers, ensuring computational efficiency and scalability. Our results suggest that this methodology offers a practical solution for litter detection, balancing accuracy and efficiency in real-world applications.

Ссылки и действия