Dynamic User-controllable Privacy-preserving Few-shot Sensing Framework

2508.03989v1 cs.LG, cs.AI 2025-08-09
Авторы:

Ajesh Koyatan Chathoth, Shuhao Yu, Stephen Lee

Резюме на русском

--- title: КОНТЕКСТ И ПРОБЛЕМАТИКА --- ### message ## КОНТЕКСТ И ПРОБЛЕМАТИКА В современных сенсорных системах, оснащенных датчиками Inertial Measurement Unit (IMU), такими как смартфоны и wearable-устройства, проблема защиты конфиденциальности пользователей приобретает все большее значение. Данные, получаемые от IMU-сенсоров, представляют собой богатые временные ряды, которые могут непреднамеренно раскрывать чувствительную информацию о поведении пользователей, такую как движения, занятия спортом или даже медицинские условия. Эта проблема усугубляется тем, что предпочтения пользователей в отношении конфиденциальности могут значительно различаться и изменяться со временем. Большинство существующих подходов к защите конфиденциальности базируются на статических, предварительно определенных категориях конфиденциальности, что ограничивает гибкость и контроль пользователя. Кроме того, многие методы требуют значительных объемов данных для обучения, что создает дополнительные трудности в реальных условиях. В этой работе авторы предлагают PrivCLIP, фреймворк, который решает эти проблемы, предоставляя динамический, пользователь-контролируемый метод защиты конфиденциальности в режиме few-shot. Это позволяет пользователям определять и модифицировать свои предпочтения по конфиденциальности, распределяя действия на категории: чувствительные (black-listed), нечувствительные (white-listed) и нейтральные (gray-listed). ## ПРЕДЛОЖЕННЫЙ МЕТОД PrivCLIP основан на мультимодальном контрастивном обучении, которое выравнивает данные IMU-сенсоров с естественными текстовыми описаниями действий в общем пространстве вложений. Это позволяет системе определять чувствительные действия с минимальным количеством обучающих данных. При обнаружении чувствительного действия система использует языковой руководствованием activity sanitizer и модуль motion generation (IMU-GPT) для трансформации исходных данных в версию, соответствующую нечувствительным действиям. Это гарантирует сохранение семантической близости, не раскрывая конфиденциальную информацию. Техническая архитектура PrivCLIP включает в себя модуль для построения вложений, контрастивное обучение и генеративную модель IMU-GPT. Эти компоненты взаимодействуют для обеспечения эффективной и настраиваемой защиты конфиденциальности. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели эксперименты на нескольких датасетах по распознаванию человеческих действий, сравнивая PrivCLIP с базовыми методами. Результаты показали значительное улучшение как в защите конфиденциальности, так и в сохранении полезности данных. PrivCLIP эффективно классифицирует чувствительные и нечувствительные действия, одновременно обеспечивая высококачественную трансформацию данных. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ PrivCLIP открывает новые возможности для защиты конфиденциальности в сенсорных системах. Его применимость очевидна в областях здравоохранения, фитнеса и мониторинга пользовательского поведения, где необходимо соблюдение конфиденциальности без потери функциональности. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ PrivCLIP представляет собой важный шаг вперед в области конфиденциальности данных, обеспечивая динамический и пользователь-контролируемый подход. Будущие исследования могут фокусироваться на расширении метода для других типов данных и улучшении эффективности генеративной модели.

Abstract

User-controllable privacy is important in modern sensing systems, as privacy preferences can vary significantly from person to person and may evolve over time. This is especially relevant in devices equipped with Inertial Measurement Unit (IMU) sensors, such as smartphones and wearables, which continuously collect rich time-series data that can inadvertently expose sensitive user behaviors. While prior work has proposed privacy-preserving methods for sensor data, most rely on static, predefined privacy labels or require large quantities of private training data, limiting their adaptability and user agency. In this work, we introduce PrivCLIP, a dynamic, user-controllable, few-shot privacy-preserving sensing framework. PrivCLIP allows users to specify and modify their privacy preferences by categorizing activities as sensitive (black-listed), non-sensitive (white-listed), or neutral (gray-listed). Leveraging a multimodal contrastive learning approach, PrivCLIP aligns IMU sensor data with natural language activity descriptions in a shared embedding space, enabling few-shot detection of sensitive activities. When a privacy-sensitive activity is identified, the system uses a language-guided activity sanitizer and a motion generation module (IMU-GPT) to transform the original data into a privacy-compliant version that semantically resembles a non-sensitive activity. We evaluate PrivCLIP on multiple human activity recognition datasets and demonstrate that it significantly outperforms baseline methods in terms of both privacy protection and data utility.

Ссылки и действия