#### Контекст
Данные с выборками ошибочных меток (label errors) оказывают негативное влияние на обучение моделей с учителем, приводя к уменьшению качества предсказаний, смещенным результатам бенчмарков и ухудшению общей точности. Несмотря на то что число данных с выборками, используемых в супервизированных задачах, растёт, существует ограниченное количество методов, которые могут эффективно обнаруживать такие ошибки в данных. Для конкретных задач, таких как сегментация изображений или обнаружение объектов, существуют методы, но они не универсальны и не применяют алгоритмы машинного обучения. Таким образом, в данной работе мы стремимся разработать широкой области применимой универсальную модель, которая способна обнаруживать ошибки в метках для объектного детектирования, сегментации изображений и инстансной сегментации.
#### Метод
Мы предлагаем метод, основанный на обучении с учителем, для обнаружения ошибок в метках по исходным данным. Метод работает следующим образом: для начала мы вручную внедряем различные типы ошибок в метки в исходные данные. Затем, мы формируем оптимальный вектор входа, который содержит изображение, исходные метки и виртуальные метки, созданные на основе внедренных ошибок. Далее, мы обучаем модель с помощью архитектуры на основе подхода Mask R-CNN, чтобы определять расположение ошибок в метках, которые делались в ходе внедрения. Мы проверяем нашу модель на синтетических данных с внедренными ошибками, а также на реальных данных с ошибками в метках.
#### Результаты
Мы проверили наш метод на нескольких задачах, включающих сегментацию изображений, объектное детектирование и инстансную сегментацию. Мы использовали несколько баз данных, включая Cityscapes, Pascal VOC и COCO. Наши результаты показали, что наш метод превосходит существующие алгоритмы в обнаружении ошибок в метках для всех задач, а также способен обнаруживать реальные ошибки в метках Cityscapes. Мы также выпустили набор данных с 459 реальными ошибками в метках Cityscapes и предоставили бенчмарк для обнаружения реальных ошибок.
#### Значимость
Метод, предложенный в нашей работе, может быть применён в различных областях, включая автоматизированное вождение, роботизированные системы, обработку изображений и другие приложения супервизированного обучения. Наш метод имеет ключевые преимущества, такие как универсальность, точность и высокая скорость. Мы считаем, что наш подход может существенно повлиять на развитие методов обнаружения ошибок в метках в будущем, и мы планируем продолжить развитие нашей модели, чтобы улучшить её возможности в распознавании реальных ошибок в метках.
#### Выводы
Мы предлагаем универса