Disentanglement of Biological and Technical Factors via Latent Space Rotation in Clinical Imaging Improves Disease Pattern Discovery
2509.11436v1
cs.CV, cs.LG
2025-09-17
Авторы:
Jeanny Pan, Philipp Seeböck, Christoph Fürböck, Svitlana Pochepnia, Jennifer Straub, Lucian Beer, Helmut Prosch, Georg Langs
Резюме на русском
## Контекст
Идентификация новых заболеваний-связанных паттернов в медицинских изображениях с помощью машинного обучения расширяет лексикон распознаваемых особенностей. Это повышает качество диагностики и прогностики. Однако изображения, помимо биологических отличий, отличаются техническими факторами, такими как параметры сканирования, производители аппаратуры и алгоритмы реконструкции. Эти технические факторы вызывают доменные разрывы, способствующие неустойчивости в обучении сетей и препятствующие выявлению биологически значимых кластеров. Для решения этой проблемы предлагается подход, основанный на активном обучении доменного отклонения посредством пост-хок-ротации пространства латентных переменных, что позволяет разделить биологические и технические факторы.
## Метод
Предлагаемая методология основывается на пост-хок-ротации пространства латентных переменных. Метод включает в себя несколько ключевых этапов. Вначале обучается модель для извлечения латентного пространства из медицинских изображений. Затем, в пространстве латентных переменных применяется ротационное преобразование, направленное на отделение биологических и технических факторов. Это преобразование достигается с помощью оптимизации, нацеленной на максимизацию значимости биологических переменных, в то же время, минимизации технических. Результатом является улучшенная устойчивость кластеров, представляющих тканевые типы, независимо от параметров сканирования.
## Результаты
На источниках реальных клинических данных проводились эксперименты для оценки полученных результатов. Были сравнены влияния подхода с локальными и глобальными методами гармонизации. Результаты показали, что ротационный подход улучшил кластерную консистентность на +19.01% (ARI), +16.85% (NMI) и +12.39% (Dice) по сравнению с энтанглированной моделью. Также проведены исследования на пациентах с идиопатической пульмонией фиброзом. Легенды, построенные на кластерах, улучшили предсказания по признакам Cox на +15% в сравнении с базовыми методами.
## Значимость
Предложенный подход может быть применен в различных областях клинического исследования, в том числе для выявления новых маркеров заболеваний. Одним из ключевых преимуществ является улучшение устойчивости кластеров в условиях технических различий, что позволяет выявлять биологически значимые шаблоны. Благодаря этому подходу можно повысить качество анализа данных в многоцентровых исследованиях и улучшить диагностические возможности.
## Выводы
Результаты экспериментов показывают, что ротационный подход в про
Abstract
Identifying new disease-related patterns in medical imaging data with the
help of machine learning enlarges the vocabulary of recognizable findings. This
supports diagnostic and prognostic assessment. However, image appearance varies
not only due to biological differences, but also due to imaging technology
linked to vendors, scanning- or re- construction parameters. The resulting
domain shifts impedes data representation learning strategies and the discovery
of biologically meaningful cluster appearances. To address these challenges, we
introduce an approach to actively learn the domain shift via post-hoc rotation
of the data latent space, enabling disentanglement of biological and technical
factors. Results on real-world heterogeneous clinical data showcase that the
learned disentangled representation leads to stable clusters representing
tissue-types across different acquisition settings. Cluster consistency is
improved by +19.01% (ARI), +16.85% (NMI), and +12.39% (Dice) compared to the
entangled representation, outperforming four state-of-the-art harmonization
methods. When using the clusters to quantify tissue composition on idiopathic
pulmonary fibrosis patients, the learned profiles enhance Cox survival
prediction. This indicates that the proposed label-free framework facilitates
biomarker discovery in multi-center routine imaging data. Code is available on
GitHub https://github.com/cirmuw/latent-space-rotation-disentanglement.
Ссылки и действия
Дополнительные ресурсы: