Linkage Attacks Expose Identity Risks in Public ECG Data Sharing

2508.15850v1 cs.CR, cs.LG 2025-08-25
Авторы:

Ziyu Wang, Elahe Khatibi, Farshad Firouzi, Sanaz Rahimi Mousavi, Krishnendu Chakrabarty, Amir M. Rahmani

Резюме на русском

## Контекст Современное развитие технологий и увеличение доступности электрокардиограмм (ECG) в области медицины и биологических исследований даровало новые возможности в лечении и профилактике заболеваний сердечно-сосудистой системы. Однако, присоединяясь к трендам в области открытого доступа к данным, широкое распространение электрокардиограмм в общественную сферу создает значительные риски для частной жизни. В недавнее время было показано, что ECG-данные обладают характеристиками, позволяющими установить идентичность лица. Это делает их подверженными атакам связывания, которые могут использоваться для идентификации или деанонимизации пользователей. Тем не менее, большинство существующих исследований по этим рискам основываются на предположении, что атакующий обладает полным доступом к данным или имеет высокотехнологичные средства, что не соответствует реальным условиям. Наша мотивация заключается в оценке рисков связывания ECG-данных в условиях реальности, где атакующий может иметь только частичный доступ к информации. ## Метод Мы использовали данные сердечных ритмов, полученных с применением различных технологий ECG (сенсоры на телефонах, специализированные устройства и т. д.) от 109 участников. Для моделирования рисков связывания на основе частичного доступа к данным мы разработали алгоритм, который использует эти частичные данные для восстановления полной идентификации. Метриками производительности стали доля успешных связываний, общая доля неверных определений и правильная идентификация неизвестных субъектов. Мы экспериментировали с разными уровнями доступа и установили оптимальные пороги доверия для минимизации ошибок. Основной критерий успешности был точность связывания идентификаторов. ## Результаты В результате экспериментов мы достигли 85% точности в правильной идентификации участников, 14.2% общей доли неверных определений и 15.6% неизвестных субъектов, которые были неправильно идентифицированы как известные, а 12.8% известных, как неизвестные. Эти результаты показывают, что даже при ограниченном доступе к данным атакующий может эффективно связать ECG-данные с идентификаторами. Интересно, что простые методы анонимизации не дают значительной защиты, что создает угрозу для частной жизни участников. Наши результаты также подтверждают, что частичная информация вполне достаточна для эффективной связывания данных. ## Значимость Результаты нашего исследования имеют важное значение для многих сфер, включая медицину, системы мониторинга здоров

Abstract

The increasing availability of publicly shared electrocardiogram (ECG) data raises critical privacy concerns, as its biometric properties make individuals vulnerable to linkage attacks. Unlike prior studies that assume idealized adversarial capabilities, we evaluate ECG privacy risks under realistic conditions where attackers operate with partial knowledge. Using data from 109 participants across diverse real-world datasets, our approach achieves 85% accuracy in re-identifying individuals in public datasets while maintaining a 14.2% overall misclassification rate at an optimal confidence threshold, with 15.6% of unknown individuals misclassified as known and 12.8% of known individuals misclassified as unknown. These results highlight the inadequacy of simple anonymization techniques in preventing re-identification, demonstrating that even limited adversarial knowledge enables effective identity linkage. Our findings underscore the urgent need for privacy-preserving strategies, such as differential privacy, access control, and encrypted computation, to mitigate re-identification risks while ensuring the utility of shared biosignal data in healthcare applications.

Ссылки и действия