Self-Validated Learning for Particle Separation: A Correctness-Based Self-Training Framework Without Human Labels

2508.16224v1 eess.IV, cs.CV 2025-08-26
Авторы:

Philipp D. Lösel, Aleese Barron, Yulai Zhang, Matthias Fabian, Benjamin Young, Nicolas Francois, Andrew M. Kingston

Резюме на русском

## Контекст Изучение твердых частиц в тканевых структурах является ключевым заданием в области томографии, особенно при работе с веществами, такими как минералы, породы и металлические конструкции. Однако точное разделение изолированных частиц в традиционных методах, таких как метод водопада, оказывается сложным из-за высокой морфологической разнообразия и частых контактов между частицами. Эти ограничения существенно снижают эффективность классических подходов в некоторых приложениях, таких как геология и материаловедение. Несмотря на то, что решения на основе нейросетей могут повысить точность, они требуют значительных ресурсов для подготовки меток, что делает их неизбежно дорогостоящими и непостоянными. Этот аспект определяет потребность в развитии автономных методов отказа от использования меток и использования непосредственных данных даже при существенных изменениях в морфологии. ## Метод Мы предлагаем **Self-Validated Learning**, новую самоподтверждающую модель для обучения без меток, которая может автономно выявлять и отделять частицы в трансляциях томографических сканов. Метод заключается в использовании негладких границ, а также в итеративном повторении процесса обучения с использованием новых наборов данных, которые получаются путем перестановок сканов. Эта методика использует механизм самопроверки, который снимает влияние шума в процессе разметки. Мы также разработали автономный метод для оценки модели, который не требует сертификатов точности и может осуществляться на основе множества производных мер, в том числе объёма и распределения частиц. ## Результаты Мы проверили модель на огромном наборе данных, включающем в том числе изображения томографической материаловедения. Наши тесты показали, что модель может значительно увеличить точность разделения частиц (до 97,3% для объёма трехмерных данных) и идентифицировать больше 54 000 частиц с различными геометрическими формами в только четырех итерационных этапах. Модель показала улучшение в распознавании даже в случаях с высокой вариативностью морфологии и сильным взаимодействием частиц. Наша модель также позволила полностью автоматизировать процесс оценки модели без необходимости использования любых стандартных меток. ## Значимость Предложенная модель может использоваться в различных областях, включая геологию, материаловедение и минералогию. Основные преимущества включают высокую точность разделения и отсутствие необходимости в ручной разметке, что сокращает время и стоимость процесса. Этот подход также обладает потенциалом для расширения применения в ря

Abstract

Non-destructive 3D imaging of large multi-particulate samples is essential for quantifying particle-level properties, such as size, shape, and spatial distribution, across applications in mining, materials science, and geology. However, accurate instance segmentation of particles in tomographic data remains challenging due to high morphological variability and frequent particle contact, which limit the effectiveness of classical methods like watershed algorithms. While supervised deep learning approaches offer improved performance, they rely on extensive annotated datasets that are labor-intensive, error-prone, and difficult to scale. In this work, we propose self-validated learning, a novel self-training framework for particle instance segmentation that eliminates the need for manual annotations. Our method leverages implicit boundary detection and iteratively refines the training set by identifying particles that can be consistently matched across reshuffled scans of the same sample. This self-validation mechanism mitigates the impact of noisy pseudo-labels, enabling robust learning from unlabeled data. After just three iterations, our approach accurately segments over 97% of the total particle volume and identifies more than 54,000 individual particles in tomographic scans of quartz fragments. Importantly, the framework also enables fully autonomous model evaluation without the need for ground truth annotations, as confirmed through comparisons with state-of-the-art instance segmentation techniques. The method is integrated into the Biomedisa image analysis platform (https://github.com/biomedisa/biomedisa/).

Ссылки и действия