AI reasoning effort mirrors human decision time on content moderation tasks

2508.20262v1 cs.AI, cs.CY 2025-08-30

Авторы:

Thomas Davidson

Резюме на русском

## Контекст Современные языковые модели на основе глубокого обучения (LLMs) достигли выдающихся результатов в упрощении широкого спектра задач, включая управление контентом. Однако понимание процесса принятия решений в этих моделях остается неоднозначным. Зачастую, LLMs не только выдают результат, но и приводят в приближенном виде последовательность логических промежуточных шагов. Это изменение способствует повышению точности решения сложных задач. Однако ключевым вопросом остается: насколько хорошо модели ориентируются в пространстве решений, аналогично тому, как это делают люди? Исследование исследует параллели между временем реакции человека и усилиями модели в процессе принятия решений, особенно в рамках задач модерации контента. ## Метод Для изучения этой темы использовался парный эксперимент типа "конджоинт" (conjoint experiment), в котором участники выполнили задачи модерации контента. Эксперимент был проведен с применением трех современных языковых моделей разных возможностей. Основной концепцией является оценка времени принятия решения участников и подсчет усилий моделей, измеренных с помощью логических промежуточных шагов. Это позволило выявить зависимость между сложностью задачи и усилиями, вложенными в ее решение. Данные для эксперимента были подготовлены с использованием реальных примеров модерации контента, что обеспечило реалистичность и практическое значение исследования. ## Результаты Результаты показали, что усилия моделей в процессе принятия решений сильно соотносятся с временем реакции участников. Из рассмотренных моделей, модель с наибольшей сложностью показала наибольшую схожесть в поведении с людьми. Оказалось, что в обоих случаях (человеческих и моделей) наблюдалось большее усилие при необходимости учитывать важные факторы, например, контекст или потенциальные последствия решения. Это наблюдение подтверждает, что модели способны выражать свое решение не только с точки зрения конечного результата, но и с точки зрения процесса принятия решения, схожего с работой человека. ## Значимость Исследование имеет значительные практические последствия для области модерации контента. Например, модели могут быть использованы для создания прозрачных алгоритмов, позволяющих понять принципы принятия решений. Также, полученные данные могут быть применены для улучшения технологий помощи персоналу в процессе модерации. Благодаря этим выводам, можно надеяться на повышение эффективности и четкости решений в области управления контентом в социальных сетях и других интернет-ресурсах. ## Выводы Это исследование показало, что модели языка могут оставаться прозрачными в процессе принятия решений, аналогич

Abstract

Large language models can now generate intermediate reasoning steps before producing answers, improving performance on difficult problems. This study uses a paired conjoint experiment on a content moderation task to examine parallels between human decision times and model reasoning effort. Across three frontier models, reasoning effort consistently predicts human decision time. Both humans and models expended greater effort when important variables were held constant, suggesting similar sensitivity to task difficulty and patterns consistent with dual-process theories of cognition. These findings show that AI reasoning effort mirrors human processing time in subjective judgments and underscores the potential of reasoning traces for interpretability and decision-making.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

AI reasoning effort mirrors human decision time on content moderation tasks

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MAGMA-Edu: Multi-Agent Generative Multimodal Framework for Text-Diagram Educatio...

AI Consciousness and Existential Risk

Efficiency Will Not Lead to Sustainable Reasoning AI

UpBench: A Dynamically Evolving Real-World Labor-Market Agentic Benchmark Framew...

JobSphere: An AI-Powered Multilingual Career Copilot for Government Employment P...

Навигация