Standardized Multi-Layer Tissue Maps for Enhanced Artificial Intelligence Integration and Search in Large-Scale Whole Slide Image Archives

2508.21418v1 cs.CV, cs.LG 2025-09-02
Авторы:

Gernot Fiala, Markus Plass, Robert Harb, Peter Regitnig, Kristijan Skok, Wael Al Zoughbi, Carmen Zerner, Paul Torke, Michaela Kargl, Heimo Müller, Tomas Brazdil, Matej Gallo, Jaroslav Kubín, Roman Stoklasa, Rudolf Nenutil, Norman Zerbe, Andreas Holzinger, Petr Holub

Резюме на русском

## Контекст Область исследований, связанная с Whole Slide Images (WSIs), широко распространена в медицинских и научных областях, включая патологию, онкологию, нурологию, иммунологию и другие. WSIs представляют собой высокоразрешные цифровые изображения, полученные сканированием целых стеков тканей или клеток. Они широко используются для разработки и тестирования алгоритмов машинного обучения (ML), а также в ряде других приложений. Однако существуют значительные проблемы, связанные с отсутствием стандартизации метаданных, необходимых для эффективного поиска и использования этих изображений в больших архивах. Эта нестандартизация затрудняет интеграцию AI в процессы анализа и поиска информации в больших данных. Наша мотивация заключается в разработке стандартизированного подхода для генерирования индексных карт WSIs и профилирования для различных доменов применения. ## Метод Мы предлагаем разработанный подход, который включает в себя генерирование двумерного индексного карты (2D-индексного отображения) для каждого WSI, а также профилирование для конкретных доменов применения. Индексное отображение является детализированным представлением содержимого WSI, состоящим из трех слоев: исходного источника, типа ткани и патологических изменений. Каждый слой сопоставляет области изображения с определенными классами, обеспечивая точную информацию о содержимом WSI. Методология включает в себя автоматическое создание этих карт и их интеграцию с машинным обучением, чтобы повысить точность и эффективность поиска и анализа в больших данных. Мы также разработали синтаксис и семантику для обеспечения совместимости между различными каталогами. ## Результаты Мы проводили эксперименты на большом количестве WSI из различных областей, включая патологию и онкологию. Данные были проанализированы с использованием нашего подхода, и результаты показали значительный повышение точности поиска и анализа в больших цифровых архивах. Мы также продемонстрировали, как наш подход может быть использован для создания графовых представлений WSIs, что дает дополнительные возможности для анализа. Мы использовали различные метрики для оценки качества профилирования и поиска, что подтвердило эффективность нашего подхода. ## Значимость Наш подход имеет широкую область применения в медицинских и научных исследованиях, в том числе в областях, где необходимо быстрый и точный поиск информации в больших цифровых архивах. Он позволяет улучшить эффективность и точность разработки AI-алгоритмов, а также облегчает интеграцию этих алгоритмов в существующие системы. Кроме того, наш подхо

Abstract

A Whole Slide Image (WSI) is a high-resolution digital image created by scanning an entire glass slide containing a biological specimen, such as tissue sections or cell samples, at multiple magnifications. These images can be viewed, analyzed, shared digitally, and are used today for Artificial Intelligence (AI) algorithm development. WSIs are used in a variety of fields, including pathology for diagnosing diseases and oncology for cancer research. They are also utilized in neurology, veterinary medicine, hematology, microbiology, dermatology, pharmacology, toxicology, immunology, and forensic science. When assembling cohorts for the training or validation of an AI algorithm, it is essential to know what is present on such a WSI. However, there is currently no standard for this metadata, so such selection has mainly been done through manual inspection, which is not suitable for large collections with several million objects. We propose a general framework to generate a 2D index map for WSI and a profiling mechanism for specific application domains. We demonstrate this approach in the field of clinical pathology, using common syntax and semantics to achieve interoperability between different catalogs. Our approach augments each WSI collection with a detailed tissue map that provides fine-grained information about the WSI content. The tissue map is organized into three layers: source, tissue type, and pathological alterations, with each layer assigning segments of the WSI to specific classes. We illustrate the advantages and applicability of the proposed standard through specific examples in WSI catalogs, Machine Learning (ML), and graph-based WSI representations.

Ссылки и действия