Evaluating Multiple Instance Learning Strategies for Automated Sebocyte Droplet Counting
2509.04895v1
cs.CV, cs.LG
2025-09-09
Авторы:
Maryam Adelipour, Gustavo Carneiro, Jeongkwon Kim
Резюме на русском
## Контекст
В области биологии себоцитов, клетек, ответственных за секрецию жировых желез, периодически возникают проблемы с точным определением и счетом липидных дозодробелей. Эти структуры, образующиеся внутри клеток в процессе их развития, являются ключевым параметром для оценки себецитарного развития. Однако традиционный метод, основанный на ручном счете по изображениям, требует больших усилий и подвержен субъективности. Из-за этого, необходима разработка автоматизированных методов, обеспечивающих точный и нейтральный счет. Наша исследовательская цель посвящена поиску эффективной автоматической системы для счета липидных дозодробелей с помощью нескольких стратегий мульти-инстансного обучения (Multiple Instance Learning, MIL).
## Метод
В этом исследовании применены два различных подхода для решения проблемы счета липидных дозодробелей. Первый, базовый многослойный перцептрон (MLP), работал на уровне патчей, агрегируя информацию по каждому отдельному куску изображения. Второй, более сложный, базировался на нескольких моделях MIL, использующих функции выделения ResNet-50, для придания веса каждому отдельному объекту в кадре. Эти модели были обучены с использованием данных, полученных из 14 классов оценки липидных дозодробелей, подготовленных с помощью зеленого цвета Nile Red для повышения точности изображений. Затем, для оценки стабильности и точности работы, проводились эксперименты с помощью пятикратного перекрёстного валидации.
## Результаты
Наблюдалось различие в производительности между двумя использованными моделями. Базовый MLP оказался более стабилен, с массовой ошибкой (Mean Absolute Error, MAE) в 5.6, что демонстрирует достаточную точность в большинстве случаев. МО с использованием MIL, несмотря на то, что иногда показывал лучшую точность в определённых случаях, был менее устойчив (средний MAE = 10.7). Это отличие показывает, что традиционная агрегация уровня "слайдов" остается эффективной для простых сценариев, но требуется дополнительная оптимизация для мульти-инстансных моделей, чтобы они показали свои преимущества.
## Значимость
Полученные результаты имеют значительное значение для анализа липидных дозодробелей в клетках себоцитов. Агрегирование на уровне слайдов (baseline MLP) оказалось простым, но эффективным подходом для быстрого и стабильного счета. МО MIL, хотя и продемонстрировало потенциал, требует дополнительных улучшений для достижения высокой стабильности. Эти результаты могут быть применены в системах автоматизации для легкого и точного определения себецитарных параметров, что у
Abstract
Sebocytes are lipid-secreting cells whose differentiation is marked by the
accumulation of intracellular lipid droplets, making their quantification a key
readout in sebocyte biology. Manual counting is labor-intensive and subjective,
motivating automated solutions. Here, we introduce a simple attention-based
multiple instance learning (MIL) framework for sebocyte image analysis. Nile
Red-stained sebocyte images were annotated into 14 classes according to droplet
counts, expanded via data augmentation to about 50,000 cells. Two models were
benchmarked: a baseline multi-layer perceptron (MLP) trained on aggregated
patch-level counts, and an attention-based MIL model leveraging ResNet-50
features with instance weighting. Experiments using five-fold cross-validation
showed that the baseline MLP achieved more stable performance (mean MAE = 5.6)
compared with the attention-based MIL, which was less consistent (mean MAE =
10.7) but occasionally superior in specific folds. These findings indicate that
simple bag-level aggregation provides a robust baseline for slide-level droplet
counting, while attention-based MIL requires task-aligned pooling and
regularization to fully realize its potential in sebocyte image analysis.
Ссылки и действия
Дополнительные ресурсы: