FedHK-MVFC: Federated Heat Kernel Multi-View Clustering
2509.15844v1
cs.LG, cs.CV, cs.DC, math.AG
2025-09-23
Авторы:
Kristina P. Sinaga
Резюме на русском
## Контекст
Область распределенных искусственных нейронных сетей (DNNs) и медицинских приложений, требующих безопасного анализа данных, становится все более актуальной в свет требований к конфиденциальности и безопасности. Одна из основных проблем заключается в сложности объединения данных из разных источников (мультивиев-данных) для одновременной обработки и анализа в среде, где необходима конфиденциальность. Например, в рамках систем медицинского мониторинга, отдельные узлы могут собирать разные типы данных (например, электрокардиограммы, рентгеновские снимки, данные о поведении). Без системы позволяющей эффективно обрабатывать такие мультивиев-данные, легко могут возникать проблемы с корреляцией и синергетическим использованием данных, что приводит к неточным выводам. Таким образом, целью данной работы является разработка эффективной методологии мультивиев-кластеризации, которая бы стала решением для улучшения выявления зависимостей и структурных признаков в мультивиев-данных, особенно в сфере медицины.
## Метод
Данная работа предлагает нейронную сеть, основанную на теории квантовых полей и федеративном обучении, с использованием терминов теории теплового ядра (Heat Kernel). Метод включает трансформацию Heat Kernel Distance (HKD), которая преобразует Евклидовы расстояния в геометрически-ориентированные меры сходства. Это позволяет адаптироваться к различным типам мультивиев-данных, включая медицинский контекст. Метод разделен на две основные части. В первой части алгоритм Heat Kernel-Enhanced Multi-View Fuzzy Clustering (HK-MVFC) предназначен для монолитного анализа в централизованной среде. Во второй части, Federated Heat Kernel Multi-View Fuzzy Clustering (FedHK-MVFC), представлена альтернатива с фокусом на защите конфиденциальности данных при многоузловом обучении. Данный подход включает в себя механизмы гарантии конфиденциальности, такие как дифференциальная частичность и агрегация защищенных данных, соответствующие требованиям HIPAA. Технически, сеть оптимизирует кластеризацию с использованием новых уравнений для обновления весов и адаптивного управления весами вида данных, что позволяет повысить точность кластеризации и эффективность обработки.
## Результаты
На основе синтетических данных, симулирующих записи больных сердечно-сосудистых заболеваний, показано, что FedHK-MVFC позволяет повысить точность кластеризации на 8-12% по сравнению с централизованным подходом, при этом уменьшая объем обмена данными между узлами на 70% и сохраняя 98.2% от эффективности централизованного метода. Эксперименты проводились на данных, вкл
Abstract
In the realm of distributed AI and privacy-focused medical applications, we
propose a framework for multi-view clustering that links quantum field theory
with federated healthcare analytics. Our method uses heat-kernel coefficients
from spectral analysis to convert Euclidean distances into geometry-aware
similarity measures, capturing the structure of diverse medical data. We lay
this out through the Heat Kernel Distance (HKD) transformation with convergence
guarantees. Two algorithms are developed: Heat Kernel-Enhanced Multi-View Fuzzy
Clustering (HK-MVFC) for central analysis, and Federated Heat Kernel Multi-View
Fuzzy Clustering (FedHK-MVFC) for secure, privacy-preserving learning across
hospitals using differential privacy and secure aggregation to facilitate
HIPAA-compliant collaboration. Tests on synthetic datasets of cardiovascular
patients show an $8-12 \%$ increase in clustering accuracy, $70 \%$ reduced
communication, and $98.2 \%$ efficiency retention over centralized methods.
Validated on 10,000 patient records across two hospitals, it proves useful for
collaborative phenotyping involving ECG, cardiac imaging, and behavioral data.
Our theoretical contributions include update rules with proven convergence,
adaptive view weighting, and privacy-preserving protocols. This presents a new
standard for geometry-aware federated learning in healthcare, turning advanced
math into workable solutions for analyzing sensitive medical data while
ensuring both rigor and clinical relevance.