A Federated Learning Framework for Handling Subtype Confounding and Heterogeneity in Large-Scale Neuroimaging Diagnosis
2508.06589v1
cs.LG, cs.AI
2025-08-13
Авторы:
Xinglin Zhao, Yanwen Wang, Xiaobo Liu, Yanrong Hao, Rui Cao, Xin Wen
Резюме на русском
#### Контекст
Компьютер-ассистированное диагностирование (CAD) широко используется для анализа нейроимажинговых данных при оценке нозологий неврологического и психиатрического профиля. Однако малопробных исследований часто страдают от неповторимости результатов, тогда как большие данные становятся хаотичными из-за существующего несбалансированного распределения подтипов заболеваний. Эта проблема становится особенно актуальной при работе с нейроимажинговыми CAD-системами, где необходимо принять во внимание характеристики индивидуальных подтипов, чтобы избежать ошибок диагностики. Мы предлагаем новую федеративную методологию для решения этих проблем, которая учитывает особенности подтипов и обеспечивает гибкость в анализе больших коллекций данных.
#### Метод
Мы предложили фреймворк, основанный на структуре федеративного обучения, который учитывает характеристики отдельных подтипов. Основные модули фреймворка включают в себя динамический модуль навигации, который определяет наиболее подходящую локальную модель для данных, и модуль мета-интеграции, который объединяет результаты работы локальных моделей в единый прогноз. Мы использовали данные fMRI, включая более 1300 случаев больных депрессией и 1100 здоровых участников из нескольких исследовательских групп. Наша система также включает в себя механизмы регулирования для обеспечения гибкости и точности в работе с разными подтипами заболеваний.
#### Результаты
Мы провели эксперименты, чтобы оценить эффективность нашей системы по сравнению с существующими методами. Фреймворк показал существенное улучшение точности диагностики, достигнув среднего значения 74.06% для всех использованных источников данных. Это высшее значение было достигнуто благодаря тому, что мы учли различные подтипы заболеваний, что позволило системе более точно прогнозировать результаты. Мы также провели анализ модулей, показав, что оба модуля — навигационный и мета-интеграционный — являются ключевыми для достижения полученных результатов.
#### Значимость
Наш фреймворк может быть применен в различных областях, включая клиническое применение в диагностике и мониторинге неврологических и психиатрических расстройств. Он обеспечивает значительные преимущества в том, что он улучшает общую точность диагностики, уменьшает ошибки воспроизведения и обеспечивает гибкость при работе с разными подтипами заболеваний. Благодаря этому, наша система может стать важной частью развития персонализированной медицины и помочь в клинических решениях в области неврологии и психиатрии.
#### Выводы
Мы
Abstract
Computer-aided diagnosis (CAD) systems play a crucial role in analyzing
neuroimaging data for neurological and psychiatric disorders. However,
small-sample studies suffer from low reproducibility, while large-scale
datasets introduce confounding heterogeneity due to multiple disease subtypes
being labeled under a single category. To address these challenges, we propose
a novel federated learning framework tailored for neuroimaging CAD systems. Our
approach includes a dynamic navigation module that routes samples to the most
suitable local models based on latent subtype representations, and a
meta-integration module that combines predictions from heterogeneous local
models into a unified diagnostic output. We evaluated our framework using a
comprehensive dataset comprising fMRI data from over 1300 MDD patients and 1100
healthy controls across multiple study cohorts. Experimental results
demonstrate significant improvements in diagnostic accuracy and robustness
compared to traditional methods. Specifically, our framework achieved an
average accuracy of 74.06\% across all tested sites, showcasing its
effectiveness in handling subtype heterogeneity and enhancing model
generalizability. Ablation studies further confirmed the importance of both the
dynamic navigation and meta-integration modules in improving performance. By
addressing data heterogeneity and subtype confounding, our framework advances
reliable and reproducible neuroimaging CAD systems, offering significant
potential for personalized medicine and clinical decision-making in neurology
and psychiatry.
Ссылки и действия
Дополнительные ресурсы: