Standardized Multi-Layer Tissue Maps for Enhanced Artificial Intelligence Integration and Search in Large-Scale Whole Slide Image Archives
2508.21418v1
cs.CV, cs.LG
2025-09-02
Авторы:
Gernot Fiala, Markus Plass, Robert Harb, Peter Regitnig, Kristijan Skok, Wael Al Zoughbi, Carmen Zerner, Paul Torke, Michaela Kargl, Heimo Müller, Tomas Brazdil, Matej Gallo, Jaroslav Kubín, Roman Stoklasa, Rudolf Nenutil, Norman Zerbe, Andreas Holzinger, Petr Holub
Резюме на русском
## Контекст
Область исследований, связанная с Whole Slide Images (WSIs), широко распространена в медицинских и научных областях, включая патологию, онкологию, нурологию, иммунологию и другие. WSIs представляют собой высокоразрешные цифровые изображения, полученные сканированием целых стеков тканей или клеток. Они широко используются для разработки и тестирования алгоритмов машинного обучения (ML), а также в ряде других приложений. Однако существуют значительные проблемы, связанные с отсутствием стандартизации метаданных, необходимых для эффективного поиска и использования этих изображений в больших архивах. Эта нестандартизация затрудняет интеграцию AI в процессы анализа и поиска информации в больших данных. Наша мотивация заключается в разработке стандартизированного подхода для генерирования индексных карт WSIs и профилирования для различных доменов применения.
## Метод
Мы предлагаем разработанный подход, который включает в себя генерирование двумерного индексного карты (2D-индексного отображения) для каждого WSI, а также профилирование для конкретных доменов применения. Индексное отображение является детализированным представлением содержимого WSI, состоящим из трех слоев: исходного источника, типа ткани и патологических изменений. Каждый слой сопоставляет области изображения с определенными классами, обеспечивая точную информацию о содержимом WSI. Методология включает в себя автоматическое создание этих карт и их интеграцию с машинным обучением, чтобы повысить точность и эффективность поиска и анализа в больших данных. Мы также разработали синтаксис и семантику для обеспечения совместимости между различными каталогами.
## Результаты
Мы проводили эксперименты на большом количестве WSI из различных областей, включая патологию и онкологию. Данные были проанализированы с использованием нашего подхода, и результаты показали значительный повышение точности поиска и анализа в больших цифровых архивах. Мы также продемонстрировали, как наш подход может быть использован для создания графовых представлений WSIs, что дает дополнительные возможности для анализа. Мы использовали различные метрики для оценки качества профилирования и поиска, что подтвердило эффективность нашего подхода.
## Значимость
Наш подход имеет широкую область применения в медицинских и научных исследованиях, в том числе в областях, где необходимо быстрый и точный поиск информации в больших цифровых архивах. Он позволяет улучшить эффективность и точность разработки AI-алгоритмов, а также облегчает интеграцию этих алгоритмов в существующие системы. Кроме того, наш подхо
Abstract
A Whole Slide Image (WSI) is a high-resolution digital image created by
scanning an entire glass slide containing a biological specimen, such as tissue
sections or cell samples, at multiple magnifications. These images can be
viewed, analyzed, shared digitally, and are used today for Artificial
Intelligence (AI) algorithm development. WSIs are used in a variety of fields,
including pathology for diagnosing diseases and oncology for cancer research.
They are also utilized in neurology, veterinary medicine, hematology,
microbiology, dermatology, pharmacology, toxicology, immunology, and forensic
science.
When assembling cohorts for the training or validation of an AI algorithm, it
is essential to know what is present on such a WSI. However, there is currently
no standard for this metadata, so such selection has mainly been done through
manual inspection, which is not suitable for large collections with several
million objects.
We propose a general framework to generate a 2D index map for WSI and a
profiling mechanism for specific application domains. We demonstrate this
approach in the field of clinical pathology, using common syntax and semantics
to achieve interoperability between different catalogs.
Our approach augments each WSI collection with a detailed tissue map that
provides fine-grained information about the WSI content. The tissue map is
organized into three layers: source, tissue type, and pathological alterations,
with each layer assigning segments of the WSI to specific classes.
We illustrate the advantages and applicability of the proposed standard
through specific examples in WSI catalogs, Machine Learning (ML), and
graph-based WSI representations.
Ссылки и действия
Дополнительные ресурсы: