Beyond PII: How Users Attempt to Estimate and Mitigate Implicit LLM Inference
2509.12152v1
cs.HC, cs.AI
2025-09-17
Авторы:
Synthia Wang, Sai Teja Peddinti, Nina Taft, Nick Feamster
Резюме на русском
## Контекст
Large Language Models (LLMs), такие как ChatGPT, могут подразумевать личные атрибуты из текста, даже если этот текст кажется беззначимым. Это создает риски для конфиденциальности, которые выходят за рамки простого утечки запоминанных данных. Хотя исследования уже показали эти риски, мало что известно о том, как пользователи оценивают и реагируют на такие угрозы. Наше исследование основывается на предыдущих работах, подчеркивая необходимость детального понимания того, как пользователи оценивают информационные риски и пытаются их минимизировать. Мы стремимся выявить способы, которые пользователи используют для защиты своей конфиденциальности при интеракции с LLMs.
## Метод
Мы провели исследовательский эксперимент с участием 240 участников из США. Участники проанализировали многочисленные текстовые фрагменты, оценивая их для возможности подразумевания личных данных. Они также сообщали насколько они беспокоятся о таких рисках и пытались переписать фрагменты для защиты конфиденциальности. Для сравнения, мы использовали два подхода: решения ChatGPT и Rescriber — современного стандарта средств защиты. Эксперимент был разделен на несколько этапов, включая оценку вероятности информационных рисков, сравнение решений пользователей и роботов, а также анализ стратегий переписывания.
## Результаты
Мы обнаружили, что участники имели сложности с оценкой вероятности информационных рисков, показывая результаты, которые незначительно превышали вероятность случайного угадания. Их попытки переписать текст для защиты конфиденциальности были эффективны в лишь 28% случаев, что превосходит результаты Rescriber но остается ниже результатов ChatGPT. Мы также выяснили, что наиболее распространенная стратегия — парафразирование — является также самой менее эффективной. Вместо этого, стратегии абстракции и введения неоднозначности дают более успешные результаты.
## Значимость
Наши результаты имеют значимость не только для понимания того, как пользователи реагируют на риски для конфиденциальности, но и для того, чтобы сформировать более информационно-безопасные интерфейсы для интеракций с LLMs. Мы выявили, что текущие методы защиты, такие как Rescriber, могут быть улучшены, в то время как ChatGPT уже имеет более высокую эффективность. Эти результаты могут способствовать развитию новых стратегий для защиты конфиденциальности, которые будут использоваться в будущих интерфейсах для пользователей.
## Выводы
Мы определили, что оценка информационных рисков и практики защиты конфиденциальности при интеракции с LLMs требуют дополнительных иссле
Abstract
Large Language Models (LLMs) such as ChatGPT can infer personal attributes
from seemingly innocuous text, raising privacy risks beyond memorized data
leakage. While prior work has demonstrated these risks, little is known about
how users estimate and respond. We conducted a survey with 240 U.S.
participants who judged text snippets for inference risks, reported concern
levels, and attempted rewrites to block inference. We compared their rewrites
with those generated by ChatGPT and Rescriber, a state-of-the-art sanitization
tool. Results show that participants struggled to anticipate inference,
performing a little better than chance. User rewrites were effective in just
28\% of cases - better than Rescriber but worse than ChatGPT. We examined our
participants' rewriting strategies, and observed that while paraphrasing was
the most common strategy it is also the least effective; instead abstraction
and adding ambiguity were more successful. Our work highlights the importance
of inference-aware design in LLM interactions.
Ссылки и действия
Дополнительные ресурсы: