Are Humans as Brittle as Large Language Models?
2509.07869v1
cs.CL, cs.HC
2025-09-11
Авторы:
Jiahui Li, Sean Papay, Roman Klinger
Резюме на русском
## Контекст
Большие языковые модели (LLM) широко используются в различных приложениях, но их вывод часто является непоследовательным из-за недетерминированности процесса декодирования и характера запросов (prompts). Это неустойчивость может воспроизводить разногласия в поведении человеческих аннотаторов из-за потенциальных изменений в условиях задания. Несмотря на распространенное предположение о том, что отклонения в поведении LLMs отражаются в поведении людей, это не было до конца исследовано. Естественный вопрос: насколько чувствителен человек к изменениям в инструкциях, подобным тем, что встречаются в LLMs? Если ответ на этот вопрос положительный, то необходимо определить, является ли эта чувствительность проблемой или, наоборот, отражением общих человеческих признаков. Данная работа стремится заполнить этот промежуток в знаниях, сравнив чувствительность человеческих аннотаторов к модификациям инструкций с чувствительностью LLMs к модификациям запросов.
## Метод
Для сравнения чувствительности человеческих аннотаторов и LLM к модификациям запросов было проведено систематическое исследование. В качестве тестовой задачи был использован текстовый классификатор, а как обучающие данные — набор текстов с привязанными к ним меток. Модификации запросов включали замену меток на альтернативные, изменение формата меток, добавление шума в форматировании и прочие типы модификаций. Для каждой модификации были проведены эксперименты с группами людей и с LLM, а результаты были измерены и сравнены с помощью метрик точности и разброса.
## Результаты
Исследования показали, что и человеческие аннотаторы, и LLM оказались чувствительными к модификациям запросов, но различия в их поведении были заметны. Обе группы показали большую чувствительность к заменам меток и изменениям формата меток. Однако человеческие аннотаторы были менее чувствительны к типографским ошибкам и изменениям порядка меток в сравнении с LLM. Эти результаты указывают на то, что человеческие аннотаторы также чувствительны к изменениям в инструкциях, хотя именно в части типографских ошибок их чувствительность ниже, чем у LLM.
## Значимость
Результаты этих исследований имеют значительное значение для понимания интерфейсов между человеческими аннотаторами и LLM. Они подтверждают, что чувствительность к изменениям в инструкциях является общим явлением в человеческом и искусственном анализе. Это указывает на возможность использования LLM для моделирования человеческого поведения при анализе текстов. Будущие исследования должны ориентироваться на развитие более у
Abstract
The output of large language models (LLM) is unstable, due to both
non-determinism of the decoding process as well as to prompt brittleness. While
the intrinsic non-determinism of LLM generation may mimic existing uncertainty
in human annotations through distributional shifts in outputs, it is largely
assumed, yet unexplored, that the prompt brittleness effect is unique to LLMs.
This raises the question: do human annotators show similar sensitivity to
instruction changes? If so, should prompt brittleness in LLMs be considered
problematic? One may alternatively hypothesize that prompt brittleness
correctly reflects human annotation variances. To fill this research gap, we
systematically compare the effects of prompt modifications on LLMs and
identical instruction modifications for human annotators, focusing on the
question of whether humans are similarly sensitive to prompt perturbations. To
study this, we prompt both humans and LLMs for a set of text classification
tasks conditioned on prompt variations. Our findings indicate that both humans
and LLMs exhibit increased brittleness in response to specific types of prompt
modifications, particularly those involving the substitution of alternative
label sets or label formats. However, the distribution of human judgments is
less affected by typographical errors and reversed label order than that of
LLMs.
Ссылки и действия
Дополнительные ресурсы: