Self-Validated Learning for Particle Separation: A Correctness-Based Self-Training Framework Without Human Labels
2508.16224v1
eess.IV, cs.CV
2025-08-26
Авторы:
Philipp D. Lösel, Aleese Barron, Yulai Zhang, Matthias Fabian, Benjamin Young, Nicolas Francois, Andrew M. Kingston
Резюме на русском
## Контекст
Изучение твердых частиц в тканевых структурах является ключевым заданием в области томографии, особенно при работе с веществами, такими как минералы, породы и металлические конструкции. Однако точное разделение изолированных частиц в традиционных методах, таких как метод водопада, оказывается сложным из-за высокой морфологической разнообразия и частых контактов между частицами. Эти ограничения существенно снижают эффективность классических подходов в некоторых приложениях, таких как геология и материаловедение. Несмотря на то, что решения на основе нейросетей могут повысить точность, они требуют значительных ресурсов для подготовки меток, что делает их неизбежно дорогостоящими и непостоянными. Этот аспект определяет потребность в развитии автономных методов отказа от использования меток и использования непосредственных данных даже при существенных изменениях в морфологии.
## Метод
Мы предлагаем **Self-Validated Learning**, новую самоподтверждающую модель для обучения без меток, которая может автономно выявлять и отделять частицы в трансляциях томографических сканов. Метод заключается в использовании негладких границ, а также в итеративном повторении процесса обучения с использованием новых наборов данных, которые получаются путем перестановок сканов. Эта методика использует механизм самопроверки, который снимает влияние шума в процессе разметки. Мы также разработали автономный метод для оценки модели, который не требует сертификатов точности и может осуществляться на основе множества производных мер, в том числе объёма и распределения частиц.
## Результаты
Мы проверили модель на огромном наборе данных, включающем в том числе изображения томографической материаловедения. Наши тесты показали, что модель может значительно увеличить точность разделения частиц (до 97,3% для объёма трехмерных данных) и идентифицировать больше 54 000 частиц с различными геометрическими формами в только четырех итерационных этапах. Модель показала улучшение в распознавании даже в случаях с высокой вариативностью морфологии и сильным взаимодействием частиц. Наша модель также позволила полностью автоматизировать процесс оценки модели без необходимости использования любых стандартных меток.
## Значимость
Предложенная модель может использоваться в различных областях, включая геологию, материаловедение и минералогию. Основные преимущества включают высокую точность разделения и отсутствие необходимости в ручной разметке, что сокращает время и стоимость процесса. Этот подход также обладает потенциалом для расширения применения в ря
Abstract
Non-destructive 3D imaging of large multi-particulate samples is essential
for quantifying particle-level properties, such as size, shape, and spatial
distribution, across applications in mining, materials science, and geology.
However, accurate instance segmentation of particles in tomographic data
remains challenging due to high morphological variability and frequent particle
contact, which limit the effectiveness of classical methods like watershed
algorithms. While supervised deep learning approaches offer improved
performance, they rely on extensive annotated datasets that are
labor-intensive, error-prone, and difficult to scale. In this work, we propose
self-validated learning, a novel self-training framework for particle instance
segmentation that eliminates the need for manual annotations. Our method
leverages implicit boundary detection and iteratively refines the training set
by identifying particles that can be consistently matched across reshuffled
scans of the same sample. This self-validation mechanism mitigates the impact
of noisy pseudo-labels, enabling robust learning from unlabeled data. After
just three iterations, our approach accurately segments over 97% of the total
particle volume and identifies more than 54,000 individual particles in
tomographic scans of quartz fragments. Importantly, the framework also enables
fully autonomous model evaluation without the need for ground truth
annotations, as confirmed through comparisons with state-of-the-art instance
segmentation techniques. The method is integrated into the Biomedisa image
analysis platform (https://github.com/biomedisa/biomedisa/).
Ссылки и действия
Дополнительные ресурсы: