Understanding the Essence: Delving into Annotator Prototype Learning for Multi-Class Annotation Aggregation

2508.02123v1 cs.LG, stat.ML 2025-08-09
Авторы:

Ju Chen, Jun Feng, Shenyu Zhang

Резюме на русском

## Контекст Многоклассовая классификация широко используется в различных задачах машинного обучения, от обнаружения объектов до текстового анализа. Одной из ключевых проблем в этой области является эффективное объединение многочисленных, иногда шумных и биазированных аннотаций от нескольких аннотирующих субъектов. Техника truth inference (интерпретация истины) стала критическим инструментом для решения этой задачи. Однако существующие методы сталкиваются с двумя основными проблемами: 1) когда многие аннотирующие субъекты помечают только небольшое число задач, или когда классы сильно имбалансированы, оценка конфиденциальных матриц часто недостоверна, и 2) единственная конфиденциальная матрица не может полностью выразить собственные шаблоны экспертности каждого аннотирующего субъекта во всех задачах. Наша работа направлена на решение этих проблем, предлагая более надежный и гибкий подход к моделированию экспертности. ## Метод Мы предлагаем метод PTBCC (ProtoType learning-driven Bayesian Classifier Combination), основанный на моделировании прототипа. Наш подход основывается на предположении, что существует множество прототипов конфиденциальных матриц, которые характеризуют вклад каждого аннотирующего субъекта. Вместо того чтобы использовать одну конфиденциальную матрицу для каждого аннотирующего субъекта, мы представляем его экспертность с помощью Dirichlet-распределения над этими прототипами. Это позволяет более точно и гибко описывать шаблоны экспертности, даже когда данные ограничены или несбалансированы. PTBCC также включает в себя методы сжатия и активного обучения, чтобы улучшить вычислительную эффективность и оптимизировать результаты. ## Результаты Мы проверили наш метод на 11 реальных датасетах, включая задачи многоклассовой классификации и многоетикетной классификации. Эксперименты показали, что PTBCC дает до 15% улучшения точности в лучшем случае и 3% выигрыша в среднем по сравнению с состоянием технологии. Более того, PTBCC снизил вычислительный затрат на 90%, что делает его эффективным для реального применения. Эти результаты подтверждают то, что наш подход существенно превосходит существующие методы в области truth inference. ## Значимость PTBCC может использоваться в широком спектре задач, от анализа социальных сетей до обнаружения объектов на изображениях. Его основное преимущество заключается в том, что он может эффективно обрабатывать данные с противоречивыми или недостаточными аннотациями, что часто встречается в реальном мире. Этот подход также может помочь улучшить качество решений в сложных многоклассовых задачах, где существует

Abstract

Multi-class classification annotations have significantly advanced AI applications, with truth inference serving as a critical technique for aggregating noisy and biased annotations. Existing state-of-the-art methods typically model each annotator's expertise using a confusion matrix. However, these methods suffer from two widely recognized issues: 1) when most annotators label only a few tasks, or when classes are imbalanced, the estimated confusion matrices are unreliable, and 2) a single confusion matrix often remains inadequate for capturing each annotator's full expertise patterns across all tasks. To address these issues, we propose a novel confusion-matrix-based method, PTBCC (ProtoType learning-driven Bayesian Classifier Combination), to introduce a reliable and richer annotator estimation by prototype learning. Specifically, we assume that there exists a set $S$ of prototype confusion matrices, which capture the inherent expertise patterns of all annotators. Rather than a single confusion matrix, the expertise per annotator is extended as a Dirichlet prior distribution over these prototypes. This prototype learning-driven mechanism circumvents the data sparsity and class imbalance issues, ensuring a richer and more flexible characterization of annotators. Extensive experiments on 11 real-world datasets demonstrate that PTBCC achieves up to a 15% accuracy improvement in the best case, and a 3% higher average accuracy while reducing computational cost by over 90%.

Ссылки и действия