Dark Patterns Meet GUI Agents: LLM Agent Susceptibility to Manipulative Interfaces and the Role of Human Oversight

2509.10723v1 cs.HC, cs.AI 2025-09-17
Авторы:

Jingyu Tang, Chaoran Chen, Jiawen Li, Zhiping Zhang, Bingcan Guo, Ibrahim Khalilov, Simret Araya Gebreegziabher, Bingsheng Yao, Dakuo Wang, Yanfang Ye, Tianshi Li, Ziang Xiao, Yaxing Yao, Toby Jia-Jun Li

Резюме на русском

## Контекст Графические пользовательские интерфейсы (GUI) становятся все более интеллектуальными благодаря технологиям глубокого обучения и генерируемым с помощью лингвистических моделей (LLM). Эти технологии позволяют автоматизировать сложные задачи и увеличивают эффективность пользовательского опыта. Однако с другой стороны, GUI-agents могут стать жертвами "dark patterns" (девиаторных дизайнерских методов), которые способны манипулировать пользователями и вызвать негативные последствия для их решений и самодержавия. Несмотря на то, что существует значительное количество исследований по влиянию "dark patterns" на людей, мало что известно о том, как эти методы влияют на GUI-agents. Это создает необходимость в понимании того, как агенты машинного обучения отреагируют на эти методы, чтобы обеспечить безопасность, автономность и эффективность контроля за ними. ## Метод Для изучения этого вопроса была проведена двухфазная эмпирическая исследовательская работа. В первой фазе проведены эксперименты, в которых LLM-powered GUI-agents взаимодействовали с различными "dark patterns", а на второй – с участием человеческого участника. В качестве агентов использовались GUI-agents, которые автоматизировали различные задачи. Набор данных включал 16 различных типов "dark patterns", среди которых были различные типы ошибок в различных условиях и сценариях. Наблюдения включали в себя оценку производительности агентов, а также выявление ситуаций, когда они проваливались или успешно избегали манипуляций. ## Результаты Результаты экспериментов показали, что GUI-agents часто не в состоянии идентифицировать "dark patterns", даже когда они имеют возможность взаимодействовать с ними. В то же время, когда они распознали такие методы, они часто отдавали предпочтение выполнению задач, а не защите от мошенничества. Были выявлены различные формы провала: у людей – нарушение логики и ловушка привычного поведения, а у агентов – процедурные слепые пятна, когда они не могут учесть неожиданные манипуляции. Однако когда люди участвовали в командах с AI-agents, их помощь достигала усовершенствования результатов, хотя это приводило к стоимости в виде увеличения концентрации внимания и усилий на управление. ## Значимость Результаты этих исследований могут быть применены в различных областях, например, в сфере электронной коммерции, социальных медиа и других системах, где GUI-agents используются в качестве помощников. Выявленные риски открывают пути к разработке более транспарентных интерфейсов, а также развитию адаптивного контроля, позволяющего пользователю самостоятельно решать, какие задачи будут выполняться аг

Abstract

The dark patterns, deceptive interface designs manipulating user behaviors, have been extensively studied for their effects on human decision-making and autonomy. Yet, with the rising prominence of LLM-powered GUI agents that automate tasks from high-level intents, understanding how dark patterns affect agents is increasingly important. We present a two-phase empirical study examining how agents, human participants, and human-AI teams respond to 16 types of dark patterns across diverse scenarios. Phase 1 highlights that agents often fail to recognize dark patterns, and even when aware, prioritize task completion over protective action. Phase 2 revealed divergent failure modes: humans succumb due to cognitive shortcuts and habitual compliance, while agents falter from procedural blind spots. Human oversight improved avoidance but introduced costs such as attentional tunneling and cognitive load. Our findings show neither humans nor agents are uniformly resilient, and collaboration introduces new vulnerabilities, suggesting design needs for transparency, adjustable autonomy, and oversight.

Ссылки и действия