Linkage Attacks Expose Identity Risks in Public ECG Data Sharing
2508.15850v1
cs.CR, cs.LG
2025-08-25
Авторы:
Ziyu Wang, Elahe Khatibi, Farshad Firouzi, Sanaz Rahimi Mousavi, Krishnendu Chakrabarty, Amir M. Rahmani
Резюме на русском
## Контекст
Современное развитие технологий и увеличение доступности электрокардиограмм (ECG) в области медицины и биологических исследований даровало новые возможности в лечении и профилактике заболеваний сердечно-сосудистой системы. Однако, присоединяясь к трендам в области открытого доступа к данным, широкое распространение электрокардиограмм в общественную сферу создает значительные риски для частной жизни. В недавнее время было показано, что ECG-данные обладают характеристиками, позволяющими установить идентичность лица. Это делает их подверженными атакам связывания, которые могут использоваться для идентификации или деанонимизации пользователей. Тем не менее, большинство существующих исследований по этим рискам основываются на предположении, что атакующий обладает полным доступом к данным или имеет высокотехнологичные средства, что не соответствует реальным условиям. Наша мотивация заключается в оценке рисков связывания ECG-данных в условиях реальности, где атакующий может иметь только частичный доступ к информации.
## Метод
Мы использовали данные сердечных ритмов, полученных с применением различных технологий ECG (сенсоры на телефонах, специализированные устройства и т. д.) от 109 участников. Для моделирования рисков связывания на основе частичного доступа к данным мы разработали алгоритм, который использует эти частичные данные для восстановления полной идентификации. Метриками производительности стали доля успешных связываний, общая доля неверных определений и правильная идентификация неизвестных субъектов. Мы экспериментировали с разными уровнями доступа и установили оптимальные пороги доверия для минимизации ошибок. Основной критерий успешности был точность связывания идентификаторов.
## Результаты
В результате экспериментов мы достигли 85% точности в правильной идентификации участников, 14.2% общей доли неверных определений и 15.6% неизвестных субъектов, которые были неправильно идентифицированы как известные, а 12.8% известных, как неизвестные. Эти результаты показывают, что даже при ограниченном доступе к данным атакующий может эффективно связать ECG-данные с идентификаторами. Интересно, что простые методы анонимизации не дают значительной защиты, что создает угрозу для частной жизни участников. Наши результаты также подтверждают, что частичная информация вполне достаточна для эффективной связывания данных.
## Значимость
Результаты нашего исследования имеют важное значение для многих сфер, включая медицину, системы мониторинга здоров
Abstract
The increasing availability of publicly shared electrocardiogram (ECG) data
raises critical privacy concerns, as its biometric properties make individuals
vulnerable to linkage attacks. Unlike prior studies that assume idealized
adversarial capabilities, we evaluate ECG privacy risks under realistic
conditions where attackers operate with partial knowledge. Using data from 109
participants across diverse real-world datasets, our approach achieves 85%
accuracy in re-identifying individuals in public datasets while maintaining a
14.2% overall misclassification rate at an optimal confidence threshold, with
15.6% of unknown individuals misclassified as known and 12.8% of known
individuals misclassified as unknown. These results highlight the inadequacy of
simple anonymization techniques in preventing re-identification, demonstrating
that even limited adversarial knowledge enables effective identity linkage. Our
findings underscore the urgent need for privacy-preserving strategies, such as
differential privacy, access control, and encrypted computation, to mitigate
re-identification risks while ensuring the utility of shared biosignal data in
healthcare applications.
Ссылки и действия
Дополнительные ресурсы: