Accurate and Private Diagnosis of Rare Genetic Syndromes from Facial Images with Federated Deep Learning

2509.10635v1 cs.LG, cs.CR, cs.CV 2025-09-17
Авторы:

Ali Burak Ünal, Cem Ata Baykara, Peter Krawitz, Mete Akgün

Резюме на русском

## Контекст Одним из самых сложных заданий в медицине является диагностика редких генетических синдромов, которая часто осложняется отсутствием доступа к большим наборам данных и требовательным к конфиденциальности характеристикам этого процесса. Фасиальная дисморфология, то есть исследование характерных лицевых особенностей, является важной частью этого процесса. Несмотря на успех машинного обучения в этой области, существуют значительные проблемы, связанные с конфиденциальностью и доступностью данных. Данные о редких генетических синдромах часто хранятся в изолированных хранилищах, что затрудняет их объединение для обучения моделей. В этом контексте возникает необходимость разработки методов, которые обеспечат качественную диагностику и при этом сохранят конфиденциальность пациентов. ## Метод Мы предлагаем **federated GestaltMatcher**, модель, основанную на фреймворке cross-silo horizontal federated learning. Эта модель позволяет участникам (например, больницам) обучаться вместе, не передавая друг другу исходные изображения лиц. Вместо этого каждый участник вычисляет локальное представление данных в общем пространстве, и эти представления объединяются в глобальный модельный конфигурационный фреймворк. Это достигается за счет использования главной концепции этой модели: **kernel matrix computation framework**. Этот подход позволяет выполнять синдромную диагностику и обнаружение, не раскрывая конфиденциальных данных. Метод также предусматривает возможность входа новых участников в систему, которые могут использовать глобальный модельный экстрактор и настройки, зафиксированные в предыдущих итерациях обучения. ## Результаты Мы проводили эксперименты с использованием данных, представляющих редкие генетические синдромы. Модель показала близкие к centralized learning результаты, сохранив более 90% качества диагностических показателей. Было проверено, что модель остается устойчивой при различных количествах участников и в условиях неоднородных данных. Эти результаты подтверждают, что federated GestaltMatcher может обеспечить высокое качество диагноза радикально улучшая конфиденциальность и доступность данных в сравнении с традиционными методами. ## Значимость Важность нашего подхода заключается в его потенциале для расширения области диагностики редких генетических синдромов благодаря использованию федеративного обучения. Это решение может быть применено в различных медицинских учреждениях, которые работают с конфиденциальными данными. Оно обеспечивает улучшение доступности данных за счет моделирования в общем пространстве, не требуя передачи исходных данных. Благодаря этому, модель может быть применена в ситуациях, где требуется со

Abstract

Machine learning has shown promise in facial dysmorphology, where characteristic facial features provide diagnostic clues for rare genetic disorders. GestaltMatcher, a leading framework in this field, has demonstrated clinical utility across multiple studies, but its reliance on centralized datasets limits further development, as patient data are siloed across institutions and subject to strict privacy regulations. We introduce a federated GestaltMatcher service based on a cross-silo horizontal federated learning framework, which allows hospitals to collaboratively train a global ensemble feature extractor without sharing patient images. Patient data are mapped into a shared latent space, and a privacy-preserving kernel matrix computation framework enables syndrome inference and discovery while safeguarding confidentiality. New participants can directly benefit from and contribute to the system by adopting the global feature extractor and kernel configuration from previous training rounds. Experiments show that the federated service retains over 90% of centralized performance and remains robust to both varying silo numbers and heterogeneous data distributions.

Ссылки и действия

Связанные статьи

AMCR: A Framework for Assessing and Mitigating Copyright Risks in Generative Mod...

Резюме ======= ## Контекст Generative models, особенно в области текста-к-изображению, достигли невероятных успехов, о...

2025-09-05