Evaluating Multiple Instance Learning Strategies for Automated Sebocyte Droplet Counting

2509.04895v1 cs.CV, cs.LG 2025-09-09
Авторы:

Maryam Adelipour, Gustavo Carneiro, Jeongkwon Kim

Резюме на русском

## Контекст В области биологии себоцитов, клетек, ответственных за секрецию жировых желез, периодически возникают проблемы с точным определением и счетом липидных дозодробелей. Эти структуры, образующиеся внутри клеток в процессе их развития, являются ключевым параметром для оценки себецитарного развития. Однако традиционный метод, основанный на ручном счете по изображениям, требует больших усилий и подвержен субъективности. Из-за этого, необходима разработка автоматизированных методов, обеспечивающих точный и нейтральный счет. Наша исследовательская цель посвящена поиску эффективной автоматической системы для счета липидных дозодробелей с помощью нескольких стратегий мульти-инстансного обучения (Multiple Instance Learning, MIL). ## Метод В этом исследовании применены два различных подхода для решения проблемы счета липидных дозодробелей. Первый, базовый многослойный перцептрон (MLP), работал на уровне патчей, агрегируя информацию по каждому отдельному куску изображения. Второй, более сложный, базировался на нескольких моделях MIL, использующих функции выделения ResNet-50, для придания веса каждому отдельному объекту в кадре. Эти модели были обучены с использованием данных, полученных из 14 классов оценки липидных дозодробелей, подготовленных с помощью зеленого цвета Nile Red для повышения точности изображений. Затем, для оценки стабильности и точности работы, проводились эксперименты с помощью пятикратного перекрёстного валидации. ## Результаты Наблюдалось различие в производительности между двумя использованными моделями. Базовый MLP оказался более стабилен, с массовой ошибкой (Mean Absolute Error, MAE) в 5.6, что демонстрирует достаточную точность в большинстве случаев. МО с использованием MIL, несмотря на то, что иногда показывал лучшую точность в определённых случаях, был менее устойчив (средний MAE = 10.7). Это отличие показывает, что традиционная агрегация уровня "слайдов" остается эффективной для простых сценариев, но требуется дополнительная оптимизация для мульти-инстансных моделей, чтобы они показали свои преимущества. ## Значимость Полученные результаты имеют значительное значение для анализа липидных дозодробелей в клетках себоцитов. Агрегирование на уровне слайдов (baseline MLP) оказалось простым, но эффективным подходом для быстрого и стабильного счета. МО MIL, хотя и продемонстрировало потенциал, требует дополнительных улучшений для достижения высокой стабильности. Эти результаты могут быть применены в системах автоматизации для легкого и точного определения себецитарных параметров, что у

Abstract

Sebocytes are lipid-secreting cells whose differentiation is marked by the accumulation of intracellular lipid droplets, making their quantification a key readout in sebocyte biology. Manual counting is labor-intensive and subjective, motivating automated solutions. Here, we introduce a simple attention-based multiple instance learning (MIL) framework for sebocyte image analysis. Nile Red-stained sebocyte images were annotated into 14 classes according to droplet counts, expanded via data augmentation to about 50,000 cells. Two models were benchmarked: a baseline multi-layer perceptron (MLP) trained on aggregated patch-level counts, and an attention-based MIL model leveraging ResNet-50 features with instance weighting. Experiments using five-fold cross-validation showed that the baseline MLP achieved more stable performance (mean MAE = 5.6) compared with the attention-based MIL, which was less consistent (mean MAE = 10.7) but occasionally superior in specific folds. These findings indicate that simple bag-level aggregation provides a robust baseline for slide-level droplet counting, while attention-based MIL requires task-aligned pooling and regularization to fully realize its potential in sebocyte image analysis.

Ссылки и действия