Beyond Data Privacy: New Privacy Risks for Large Language Models

2509.14278v1 cs.CR, cs.AI, cs.LG 2025-09-20
Авторы:

Yuntao Du, Zitao Li, Ninghui Li, Bolin Ding

Резюме на русском

## Контекст Large Language Models (LLMs) отличаются своим неподдельным умением понимать и обрабатывать естественный язык, принимать разумные решения и выполнять автономные функции. Во времена быстрого развития интеллектуальных систем, они приобрели значительное применение в различных областях, от виртуальных помощников до моделей для сферы финансов. Однако этот прогресс привносил с ним значительные вопросы в области конфиденциальности. Несмотря на то, что многочисленные исследования стремились уменьшить риски связанные с защитой данных во время обучения моделей, меньше внимания уделялось новым угрозам, возникающим при использовании LLMs в реальных системах. Интеграция LLMs в приложения и их применение для автоматической генерации решений стали открывать новые возможности для нежелательного дата-проникновения. Эти угрозы могут привести к различным последствиям, включая легковерное разглашение пользовательских данных, финансовые потери и ухудшение доверия к технологиям. ## Метод Мы предлагаем обобщенный подход к исследованию новых рисков для конфиденциальности, связанных с выводом LLMs в производственное использование. Наше исследование основывается на многоуровневом анализе технологий, включая оценку проблем, связанных с автоматизированным разбором данных, а также определение возможных компонентов, открывающих возможности для атак. Мы рассматриваем особенности работы LLMs в различных приложениях, включая системы с широким кругом взаимодействия, и выявляем ситуации, при которых могут возникнуть дефекты в работе моделей. Затем мы проводим эмпирическую оценку этих уязвимостей, используя наборы данных, соответствующих реальным сценариям. ## Результаты Проведенные эксперименты показали, что многие LLMs, включая высокопроизводительные, оказываются уязвимыми к ряду новых угроз. Мы обнаружили, что некоторые модели могут давать ответы, в которых вкрадываются конфиденциальные данные, например, те, которые были введены в ходе обучения или тестирования. Эксперименты также показали, что злоумышленники могут использовать специально созданные запросы для извлечения конфиденциальных данных, в том числе входящих в защищенные базы. Запуск этих атак во время реального эксплуатационного использования LLMs может привести к серьезным последствиям, включая хищение персональных данных и финансовые потери. Мы также проанализировали реальные сценарии использования LLMs в сферах банковских транзакций и медицины, где подобные угрозы могут быть особенно острыми. ## Значимость Полученные результаты подчеркивают необходимость в развитии новых подходов к об

Abstract

Large Language Models (LLMs) have achieved remarkable progress in natural language understanding, reasoning, and autonomous decision-making. However, these advancements have also come with significant privacy concerns. While significant research has focused on mitigating the data privacy risks of LLMs during various stages of model training, less attention has been paid to new threats emerging from their deployment. The integration of LLMs into widely used applications and the weaponization of their autonomous abilities have created new privacy vulnerabilities. These vulnerabilities provide opportunities for both inadvertent data leakage and malicious exfiltration from LLM-powered systems. Additionally, adversaries can exploit these systems to launch sophisticated, large-scale privacy attacks, threatening not only individual privacy but also financial security and societal trust. In this paper, we systematically examine these emerging privacy risks of LLMs. We also discuss potential mitigation strategies and call for the research community to broaden its focus beyond data privacy risks, developing new defenses to address the evolving threats posed by increasingly powerful LLMs and LLM-powered systems.

Ссылки и действия