Beyond PII: How Users Attempt to Estimate and Mitigate Implicit LLM Inference

2509.12152v1 cs.HC, cs.AI 2025-09-17
Авторы:

Synthia Wang, Sai Teja Peddinti, Nina Taft, Nick Feamster

Резюме на русском

## Контекст Large Language Models (LLMs), такие как ChatGPT, могут подразумевать личные атрибуты из текста, даже если этот текст кажется беззначимым. Это создает риски для конфиденциальности, которые выходят за рамки простого утечки запоминанных данных. Хотя исследования уже показали эти риски, мало что известно о том, как пользователи оценивают и реагируют на такие угрозы. Наше исследование основывается на предыдущих работах, подчеркивая необходимость детального понимания того, как пользователи оценивают информационные риски и пытаются их минимизировать. Мы стремимся выявить способы, которые пользователи используют для защиты своей конфиденциальности при интеракции с LLMs. ## Метод Мы провели исследовательский эксперимент с участием 240 участников из США. Участники проанализировали многочисленные текстовые фрагменты, оценивая их для возможности подразумевания личных данных. Они также сообщали насколько они беспокоятся о таких рисках и пытались переписать фрагменты для защиты конфиденциальности. Для сравнения, мы использовали два подхода: решения ChatGPT и Rescriber — современного стандарта средств защиты. Эксперимент был разделен на несколько этапов, включая оценку вероятности информационных рисков, сравнение решений пользователей и роботов, а также анализ стратегий переписывания. ## Результаты Мы обнаружили, что участники имели сложности с оценкой вероятности информационных рисков, показывая результаты, которые незначительно превышали вероятность случайного угадания. Их попытки переписать текст для защиты конфиденциальности были эффективны в лишь 28% случаев, что превосходит результаты Rescriber но остается ниже результатов ChatGPT. Мы также выяснили, что наиболее распространенная стратегия — парафразирование — является также самой менее эффективной. Вместо этого, стратегии абстракции и введения неоднозначности дают более успешные результаты. ## Значимость Наши результаты имеют значимость не только для понимания того, как пользователи реагируют на риски для конфиденциальности, но и для того, чтобы сформировать более информационно-безопасные интерфейсы для интеракций с LLMs. Мы выявили, что текущие методы защиты, такие как Rescriber, могут быть улучшены, в то время как ChatGPT уже имеет более высокую эффективность. Эти результаты могут способствовать развитию новых стратегий для защиты конфиденциальности, которые будут использоваться в будущих интерфейсах для пользователей. ## Выводы Мы определили, что оценка информационных рисков и практики защиты конфиденциальности при интеракции с LLMs требуют дополнительных иссле

Abstract

Large Language Models (LLMs) such as ChatGPT can infer personal attributes from seemingly innocuous text, raising privacy risks beyond memorized data leakage. While prior work has demonstrated these risks, little is known about how users estimate and respond. We conducted a survey with 240 U.S. participants who judged text snippets for inference risks, reported concern levels, and attempted rewrites to block inference. We compared their rewrites with those generated by ChatGPT and Rescriber, a state-of-the-art sanitization tool. Results show that participants struggled to anticipate inference, performing a little better than chance. User rewrites were effective in just 28\% of cases - better than Rescriber but worse than ChatGPT. We examined our participants' rewriting strategies, and observed that while paraphrasing was the most common strategy it is also the least effective; instead abstraction and adding ambiguity were more successful. Our work highlights the importance of inference-aware design in LLM interactions.

Ссылки и действия