📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Siqi Zhu, David Zhang, Pedro Cisneros-Velarde, Jiaxuan You

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large Language Models (LLMs) have achieved remarkable progress in reasoning, yet sometimes produce responses that are suboptimal for users in tasks such as writing, information seeking, or providing practical guidance. Conventional alignment practices typically assume that maximizing model reward also maximizes user welfare, but this assumption frequently fails in practice: models may over-clarify or generate overly verbose reasoning when users prefer concise answers. Such behaviors resemble the...
ID: 2510.08872v1 cs.AI, cs.GT, cs.HC, cs.LG, cs.MA
Авторы:

Crystal Qian, Kehang Zhu, John Horton, Benjamin S. Manning, Vivian Tsai, James Wexler, Nithum Thain

## Контекст За последние годы возникла ситуация, когда во многих сферах жизнедеятельности задачи, которые раньше выполнялись людьми, теперь передаются автоматизированным агентам. Это направление особенно актуально в условиях развития искусственного интеллекта, когда роль роботов и автоматизированных систем становится все более значительной. Однако необходимо не только оценить их работу, но и изучить, как эти агенты обмениваются информацией и принимают решения в процессе взаимодействия. Эта проблема актуальна, так как разные агенты обладают разными преимуществами. Например, статистические агенты, такие как модели Байеса, могут очень эффективно работать в условиях, где окружающая среда хорошо определена и стабильна. Зато большие языковые модели (LLMs), такие как GPT-4 или Gemini 1.5 Pro, показывают свои преимущества в более широком контексте и способности к гибкой адаптации. В данной работе мы сравниваем работу людей, LLMs и статистических агентов в динамической среде, где им предлагается выполнить совместные задачи, которые требуют стратегического подхода и гибкости в поведении. ## Метод Мы проводили эксперименты, в которых участвуют люди (216 участников), статистические агенты, основанные на Байесовских моделях, и модели БООМ, такие как GPT-4 и Gemini 1.5 Pro. Участники должны были выполнять таск, в котором они должны были принимать решения в динамической и непредсказуемой ситуации, когда действия одного участника могут влиять на результаты других. Мы сравнивали не только результаты (то есть, сколько каждый участник получил в итоге), но и способы принятия решений, стратегии, работающие в этой ситуации. Эксперимент был проведен в условиях, когда все участники имели одинаковые инструменты и возможности, что позволило сделать компаративные выводы. ## Результаты В результатах мы обнаружили, что у каждого из участников были свои специфические стратегии. Байесовские агенты, оптимизируя безукоризненную логику, получили наибольшую суммарную сумму, но при этом их поведение было достаточно жестким. Они часто отклоняли предложения, что приводило к провалам в сотрудничестве. Люди и LLMs, в свою очередь, показали более сбалансированное поведение. Люди старались добиться справедливости, что приводило к более высокой сумме общего блага, но при этом их решения часто были более рискованными. LLMs, в свою очередь, старались сохранять консервативность, что привело к меньшему количеству отклонений, но при этом их результаты в суммарном плане не так высоки, как у людей. Таким образом, мы можем отметить, что каж
Annotation:
Coordination tasks traditionally performed by humans are increasingly being delegated to autonomous agents. As this pattern progresses, it becomes critical to evaluate not only these agents' performance but also the processes through which they negotiate in dynamic, multi-agent environments. Furthermore, different agents exhibit distinct advantages: traditional statistical agents, such as Bayesian models, may excel under well-specified conditions, whereas large language models (LLMs) can general...
ID: 2509.09071v2 cs.AI, cs.GT, cs.HC
Авторы:

Crystal Qian, Kehang Zhu, John Horton, Benjamin S. Manning, Vivian Tsai, James Wexler, Nithum Thain

## Контекст Область исследования сосредотачивается на изучении экономических торговых выгод между людьми и автоматизированными агентами в условиях беседы. Известно, что в последние годы автоматизация традиционно ручных задач приводит к увеличению роли автоматизированных агентов. Это создает необходимость эффективного сравнения их работы, будь то статистические модели или новые технологии, такие как LLMs. Изучение этих ситуаций позволяет не только оценить выполненные результаты, но и определить суть процесса, который используется для достижения результата. Ключевая мотивация заключается в том, что без полного понимания как агенты достигают результатов, невозможно корректно оценить их вклад в реальном мире. ## Метод Для изучения вышеописанной проблемы в ходе работы использовалась методология, включающую сравнение трех типов агентов: людей, LLMs (GPT-4o, Gemini 1.5 Pro) и статистических Bayesian-агентов. Эксперимент проводился в динамических негативных условиях, что позволило сравнить поведение всех участников в одинаковых условиях. Эксперимент назван "dynamic negotiation setting", чтобы оценить не только экономический итог, но и характер работы, процесс получения решений. Для сравнения использовались данные о поведении, результатах и алгоритмах принятия решений. ## Результаты На основе экспериментов было выявлено, что как люди, так и LLMs способны достигать эквивалентного экономического результата, но это достигается по разным способам. LLMs проявляют консервативный подход, часто прибегая к примирению и ценительности, что приводит к минимуму ошибок в выборе. Люди, в свою очередь, более стратегичны и рискованны в поведении, но при этом стремятся к справедливости и равноправию, что делает их решения более гибкими. Bayesian-агенты, напротив, ориентируются на максимальное получение выгоды, но это приводит к частым отказам в концовке. ## Значимость Результаты имеют большую значимую в сферах, где необходимо оптимальное согласование в условиях многоагентной среды, например, в области торговли, логистики, или даже в интеллектуальной работе. Особенно важно, что работа показывает, что высокий экономический результат не всегда означает эффективность в процессе, так как разные агенты могут прийти к одинаковому итогу по разным путям. Это потенциально влияет на технологические решения, включая разработку более гуманных и удобных интерфейсов, в которых необходимо учитывать не только результат, но и процесс, который достигает этого результата. ## Выводы Основными достижениями работы является подтверждение того, что LLMs и люди могут достигать эквивалентных экономических результатов,
Annotation:
Coordination tasks traditionally performed by humans are increasingly being delegated to autonomous agents. As this pattern progresses, it becomes critical to evaluate not only these agents' performance but also the processes through which they negotiate in dynamic, multi-agent environments. Furthermore, different agents exhibit distinct advantages: traditional statistical agents, such as Bayesian models, may excel under well-specified conditions, whereas large language models (LLMs) can general...
ID: 2509.09071v1 cs.AI, cs.GT, cs.HC