Disentanglement of Biological and Technical Factors via Latent Space Rotation in Clinical Imaging Improves Disease Pattern Discovery

2509.11436v1 cs.CV, cs.LG 2025-09-17
Авторы:

Jeanny Pan, Philipp Seeböck, Christoph Fürböck, Svitlana Pochepnia, Jennifer Straub, Lucian Beer, Helmut Prosch, Georg Langs

Резюме на русском

## Контекст Идентификация новых заболеваний-связанных паттернов в медицинских изображениях с помощью машинного обучения расширяет лексикон распознаваемых особенностей. Это повышает качество диагностики и прогностики. Однако изображения, помимо биологических отличий, отличаются техническими факторами, такими как параметры сканирования, производители аппаратуры и алгоритмы реконструкции. Эти технические факторы вызывают доменные разрывы, способствующие неустойчивости в обучении сетей и препятствующие выявлению биологически значимых кластеров. Для решения этой проблемы предлагается подход, основанный на активном обучении доменного отклонения посредством пост-хок-ротации пространства латентных переменных, что позволяет разделить биологические и технические факторы. ## Метод Предлагаемая методология основывается на пост-хок-ротации пространства латентных переменных. Метод включает в себя несколько ключевых этапов. Вначале обучается модель для извлечения латентного пространства из медицинских изображений. Затем, в пространстве латентных переменных применяется ротационное преобразование, направленное на отделение биологических и технических факторов. Это преобразование достигается с помощью оптимизации, нацеленной на максимизацию значимости биологических переменных, в то же время, минимизации технических. Результатом является улучшенная устойчивость кластеров, представляющих тканевые типы, независимо от параметров сканирования. ## Результаты На источниках реальных клинических данных проводились эксперименты для оценки полученных результатов. Были сравнены влияния подхода с локальными и глобальными методами гармонизации. Результаты показали, что ротационный подход улучшил кластерную консистентность на +19.01% (ARI), +16.85% (NMI) и +12.39% (Dice) по сравнению с энтанглированной моделью. Также проведены исследования на пациентах с идиопатической пульмонией фиброзом. Легенды, построенные на кластерах, улучшили предсказания по признакам Cox на +15% в сравнении с базовыми методами. ## Значимость Предложенный подход может быть применен в различных областях клинического исследования, в том числе для выявления новых маркеров заболеваний. Одним из ключевых преимуществ является улучшение устойчивости кластеров в условиях технических различий, что позволяет выявлять биологически значимые шаблоны. Благодаря этому подходу можно повысить качество анализа данных в многоцентровых исследованиях и улучшить диагностические возможности. ## Выводы Результаты экспериментов показывают, что ротационный подход в про

Abstract

Identifying new disease-related patterns in medical imaging data with the help of machine learning enlarges the vocabulary of recognizable findings. This supports diagnostic and prognostic assessment. However, image appearance varies not only due to biological differences, but also due to imaging technology linked to vendors, scanning- or re- construction parameters. The resulting domain shifts impedes data representation learning strategies and the discovery of biologically meaningful cluster appearances. To address these challenges, we introduce an approach to actively learn the domain shift via post-hoc rotation of the data latent space, enabling disentanglement of biological and technical factors. Results on real-world heterogeneous clinical data showcase that the learned disentangled representation leads to stable clusters representing tissue-types across different acquisition settings. Cluster consistency is improved by +19.01% (ARI), +16.85% (NMI), and +12.39% (Dice) compared to the entangled representation, outperforming four state-of-the-art harmonization methods. When using the clusters to quantify tissue composition on idiopathic pulmonary fibrosis patients, the learned profiles enhance Cox survival prediction. This indicates that the proposed label-free framework facilitates biomarker discovery in multi-center routine imaging data. Code is available on GitHub https://github.com/cirmuw/latent-space-rotation-disentanglement.

Ссылки и действия