📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Alexandra Fetsch, Iurii Savvateev, Racem Ben Romdhane, Martin Wiedmann, Artemiy Dimov, Maciej Durkalec, Josef Teichmann, Jakob Zinsstag, Konstantinos Koutsoumanis, Andreja Rajkovic, Jason Mann, Mauro Tonolla, Monika Ehling-Schulz, Matthias Filter, Sophia Johler

## Контекст Огромные глобальные вызовы, такие как климатические изменения, безопасность пищевой системы и санитарно-эпидемиологический контроль, характеризуются высокой степенью сложности и взаимозависимостей. Их эффективное решение требует интегрированного и участвующего подхода. Однако традиционные фреймворки анализа рисков часто упрощают проблемы, чтобы сделать их управляемыми, создавая структуры, которые ограничивают возможности полномасштабных решений. Широкомасштабное взаимодействие между секторами и неравновесие интересов становится затрудненным из-за ограниченных временных ресурсов, огромных объемов данных и сложности интеграции разногласий. Данная статья предлагает новый подход к управлению рисками, который включает в себя использование large language models (LLMs) и AI-агентов для повышения эффективности переговоров между секторами и сбалансированного баланса интересов сторон. ## Метод Предложенный фреймворк включает в себя искусственный интеллект, основанный на LLMs, который имитирует переговоры между секторами и моделирует риски. Методология основывается на моделировании динамики переговоров, моделировании интересов сторон и анализе возможных решений. Архитектура фреймворка основывается на нейросетевых моделях, разработанных для анализа текстов, и эмуляции рисков в реальных условиях. Технические решения включают в себя методы машинного обучения, позволяющие автоматизировать анализ информации, а также интерактивные визуализации для повышения понимания сложных проблем. ## Результаты Данные результаты были получены через два реальных сценария: (i) умеренное использование биопестицида и (ii) управление населением диких животных. В этих сценариях были проведены эксперименты с использованием данных, анализирующих влияние практик на здоровье животных и человека. Результаты показали, что использование LLMs позволяло существенно улучшить процесс переговоров и упростить принятие решений. Авторы также сообщили, что инструмент демонстрирует эффективность в области моделирования рисков и может быть полезен для широкого круга пользователей, включая тех, кто имеет ограниченные ресурсы. ## Значимость Фреймворк может применяться в различных областях, включая санитарно-эпидемиологический контроль, управление рисками в области питания и здоровья, а также в секторе климатических изменений. Одним из основных преимуществ является его открытый и понятный дизайн, который может быть использован для разработки пользовательских решений. Этот подход может внести значительный вклад в создание универсаль
Annotation:
Key global challenges of our times are characterized by complex interdependencies and can only be effectively addressed through an integrated, participatory effort. Conventional risk analysis frameworks often reduce complexity to ensure manageability, creating silos that hinder comprehensive solutions. A fundamental shift towards holistic strategies is essential to enable effective negotiations between different sectors and to balance the competing interests of stakeholders. However, achieving t...
ID: 2509.09906v1 cs.MA, cs.AI
Авторы:

Xiyu Guo, Shan Wang, Chunfang Ji, Xuefeng Zhao, Wenhao Xi, Yaoyao Liu, Qinglan Li, Chao Deng, Junlan Feng

## Контекст В последние годы развитие бо LARGE LANGUAGE MODELS (LLMs) и дOMAIN-SPECIFIC AI AGENTS значительно расширило экосистему AI-подобных сервисов. Однако пользовательские запросы являются очень разнообразными и часто покрывают многообразные темы и задачи, образуя хетерогенную среду. Эта сложность приводит к существенной проблеме: как эффективно и точно направить каждый запрос к соответствующему выполняющему его модулю, с учетом оптимального баланса между эффективностью и затратами. Из этого потребности возникает мотивация для разработки модели, которая могла бы решить эту задачу, обеспечивая быструю и точную маршрутизацию запросов в различных сценариях. ## Метод Чтобы решить эту проблему, мы предлагаем **MoMA (Mixture of Models and Agents)** — расширенную фреймворк для маршрутизации, который объединяет LLM и agent-based routing. Он основывается на глубоком понимании моделей и агентов, что позволяет точно определять их способности и оптимальное использование. Мы создаем подробную датасет для профилирования моделей и агентов, чтобы определить точные задачи, для которых они являются наиболее эффективными. Во время работы фреймворк использует динамическую маршрутизацию, направляя запросы к моделям с наиболее высоким эффективностью. Кроме того, мы предлагаем стратегию для выбора агентов, основанную на контекстно-отзывчивой системе состояний и динамической маскировке, чтобы улучшить эффективность и уменьшить затраты. ## Результаты Мы проводили эксперименты с различными данными, чтобы проверить работу MoMA. Мы оценивали точность направления запросов, эффективность выполнения и стоимость работы. Результаты показали, что MoMA превосходит другие существующие подходы по этим метрикам. Например, в сценарии с многообразными запросами, где требуется сбалансированный подход, MoMA показал более высокую эффективность и меньшую задержку по сравнению с другими методами. Это подтверждает его устойчивость и гибкость в различных сценариях применения. ## Значимость MoMA предлагает широкие области применения, включая облачные сервисы, бизнес-аналитику, рекомендательные системы и другие AI-powered сервисы. Он обеспечивает более эффективную и точную маршрутизацию, что приводит к улучшению качества и экономичности систем. Его преимущества заключаются в том, что он может адаптироваться к различным запросам и моделям, обеспечивая оптимальный баланс между производительностью и затратами. Это может привести к повышению производительности в различных AI-системах, облегчив разработку и поддержание этих систем. ## Выводы MoMA представляет собой успешный подход к расширенной ма
Annotation:
The rapid advancement of large language models (LLMs) and domain-specific AI agents has greatly expanded the ecosystem of AI-powered services. User queries, however, are highly diverse and often span multiple domains and task types, resulting in a complex and heterogeneous landscape. This diversity presents a fundamental routing challenge: how to accurately direct each query to an appropriate execution unit while optimizing both performance and efficiency. To address this, we propose MoMA (Mixtu...
ID: 2509.07571v2 cs.MA, cs.AI
Авторы:

Xiyu Guo, Shan Wang, Chunfang Ji, Xuefeng Zhao, Wenhao Xi, Yaoyao Liu, Qinglan Li, Chao Deng, Junlan Feng

## Контекст В последние годы стало всё яснее, что широкомасштабное внедрение ИИ в различные сферы жизнедеятельности требует решения проблем связанных с эффективностью и стоимостью выполнения задач. Одним из ключевых проблемных моментов является то, что пользовательские запросы часто требуют обработки в разных доменах и с различными типами задач. Это создаёт сложную задачу роутинга: как правильно направить каждый запрос на соответствующую систему для обработки, чтобы максимизировать эффективность и обеспечить высокое качество выполнения. Например, запросы в сфере экономики, медицины или интернета вещей могут требовать различных типов моделей или агентов. **MoMA (Mixture of Models and Agents)** предлагается как решение для этих проблем, предлагая универсальную систему роутинга, которая использует модели ИИ для точной расстановки запросов и рационального распределения ресурсов. ## Метод **MoMA** оперирует системой "Микс моделей и агентов", которая объединяет модели ИИ с разного рода агентами. Методология предполагает развитие профиля каждой модели и агента, чтобы понять их сильные стороны и ограничения. Эта профилировка позволяет выбирать наиболее подходящую модель или агента для выполнения конкретного запроса. Разработана стратегия динамического выбора моделей и агентов, которая опирается на контекстные сигналы и маскирование. Для улучшения роутинга, был создан богатый набор данных, который позволяет профилировать модели и агенты в различных условиях. Это позволит адаптировать систему к разным запросам, обеспечивая максимальную эффективность и стоимость. ## Результаты Исследования показали, что **MoMA** существенно превосходит существующие методы в области роутинга по нескольким ключевым показателям. Например, **MoMA** обеспечивает высокое качество набора экспериментов, используя различные модели и агенты. Одним из основных показателей является эффективность роутинга: **MoMA** демонстрирует улучшение стоимости и производительности на значительные значения по сравнению с другими подходами. Это достигается за счёт точной расстановки запросов на основании их специфических особенностей и требований, а также с помощью рационального управления ресурсами. Эксперименты проводились на различных наборах данных, чтобы проверить устойчивость и кросс-доменную эффективность модели. ## Значимость **MoMA** может быть применена в различных доменах, включая экономические системы, здравоохранение, интернет-технологии и многие другие, где требуется эффективное управление запросами. Одним из основных преимуществ является **высокая эффективно
Annotation:
The rapid advancement of large language models (LLMs) and domain-specific AI agents has greatly expanded the ecosystem of AI-powered services. User queries, however, are highly diverse and often span multiple domains and task types, resulting in a complex and heterogeneous landscape. This diversity presents a fundamental routing challenge: how to accurately direct each query to an appropriate execution unit while optimizing both performance and efficiency. To address this, we propose MoMA (Mixtu...
ID: 2509.07571v1 cs.MA, cs.AI
Авторы:

Arthur Casals, Anarosa A. F. Brandão

## Контекст Многоагентные системы (MAS) широко используются в различных областях, включая системы управления, игры, моделирование процессов и транспортные системы. Однако развитие MAS часто сталкивается со сложностями, связанными с написанием кода, поддержкой и расширением систем. Интеграция MAS с распределенными системами (DS) также требует специализированных знаний, что усложняет процесс разработки и увеличивает потребность в ресурсах. Существуют готовые фреймворки, но они либо слишком широко распространены и не ориентированы на MAS, либо слишком низкоуровневые, что усложняет их применение. Необходима простая и эффективная архитектура, которая объединила бы преимущества DS и MAS, упростив разработку и поддержку многоагентных систем. ## Метод HECATE — это фреймворк, основанный на Entity-Component-System (ECS), который соединяет преимущества распределенных систем и многоагентных систем. ECS — это архитектурный паттерн, ориентированный на данные, который позволяет разрабатывать MAS с помощью привычных инструментов DS. Основная идея заключается в интеграции компонентов и систем в один процесс, что позволяет сократить необходимость в знании специфики MAS. Фреймворк реализует различные модели агентов, используя философию ECS, что делает разработку MAS более простой и удобной. ## Результаты Для исследования HECATE были проведены эксперименты, используя различные модели агентов и сценарии распределенных систем. Фреймворк позволяет создавать MAS с избыточностью и масштабируемостью, не требуя от разработчиков глубоких знаний о MAS. Эксперименты показали, что с помощью HECATE можно создавать MAS с меньшим количеством специализированных ресурсов и уменьшенным риском ошибок. Данные были собраны в различных условиях, включая разные количества агентов и различные модели распределения. ## Значимость HECATE может быть применен в различных областях, включая моделирование процессов, игры, систему управления и транспортные системы. Этот фреймворк обеспечивает уменьшение трудозатрат при разработке MAS, уменьшает вероятность ошибок в коде и увеличивает масштабируемость. Благодаря интеграции в ECS, HECATE предоставляет простой интерфейс для разработки MAS, что делает его привлекательным для широкого круга разработчиков. Его можно применять для изучения различных аспектов распределенных систем и MAS. ## Выводы HECATE — это универсальный фреймворк для разработки MAS, который упрощает процесс и повышает эффективность. Он имеет большой потенциал для развития динамичных и масштабируемых распределенных систем. Основными направлениями будущих исследований являются доработ
Annotation:
This paper introduces HECATE, a novel framework based on the Entity-Component-System (ECS) architectural pattern that bridges the gap between distributed systems engineering and MAS development. HECATE is built using the Entity-Component-System architectural pattern, leveraging data-oriented design to implement multiagent systems. This approach involves engineering multiagent systems (MAS) from a distributed systems (DS) perspective, integrating agent concepts directly into the DS domain. This a...
ID: 2509.06431v1 cs.MA, cs.AI, C.2.4, I.2.11
Авторы:

Ryosuke Takata, Atsushi Masumori, Takashi Ikegami

################################# ## Контекст ################################# В области искусственного интеллекта (ИИ) исследования сфокусированы на поведении коллективных систем, включая имитацию человеческих стратегий решения проблем. Одним из ключевых объектов исследований является традиционный El Farol Bar problem, который представляет собой классическую структуру социального дилемма. В этой ситуации игроки должны решать, стоит ли им посетить бар в определенный день, чтобы избежать переутомления от переполненного зала. Хотя ранее для решения этой задачи использовались модели гейм-теории, они не учитывали поведенческие и социальные мотивы, которые характерны для реальных людей. Ла LLM agents (Large Language Models) предлагают новый подход, включающий в себя сложную нейронную сеть, обученную на текстовых данных. Этот подход может оказаться полезным для моделирования социальных динамик, как это демонстрируется в данном исследовании. ################################# ## Метод ################################# Исследование построено на использовании LLM agents, которые автоматически определяют стратегии посещения бара, исходя из предложенных ими внешних и внутренних мотивов. Эти модели обучены на тексте, что позволяет имитировать человеческие мотивы, такие как доверие, социальные предпочтения и мнение о ситуации. Для моделирования поведения использовалась специальная архитектура сети, которая основывается на многослойном персептроне (MLP) с возможностью социального взаимодействия. Поведение агентов было протестировано в условиях специально разработанного эксперимента, в котором игроки должны были принимать решения в рамках предопределенных ограничений, таких как посещаемость бара до 60% от максимального. ################################# ## Результаты ################################# Лингвистические модели демонстрировали закономерности в поведении, которые отличались от теоретических ожиданий. Например, они не только выбирали решения, оптимизируя личный выигрыш, но и сталкивались с внутренним дилеммой: стремиться к коллективному решению или следовать индивидуальным мотивам. В результате, LLM agents показали человеческий характер решений, где ключевым мотивом является не только экономическая выгода, но и социальная связь. Эксперименты показали, что модели не отказываются от логического мышления, но при этом могут принимать решения, которые не являются оптимальными в традиционной гаме-теории. ################################# ## Значимость ################################# Результаты имеют большое значение для практических приложений в области виртуальных экономий, искусственного интеллекта и систем управления. В частности, модели могут быть применены к моделированию групповых решений, таких как экологическое управление, рыночные стратегии и социальные сети. Эти модели также открывают новые горизонты в изучени
Annotation:
We investigate the emergent social dynamics of Large Language Model (LLM) agents in a spatially extended El Farol Bar problem, observing how they autonomously navigate this classic social dilemma. As a result, the LLM agents generated a spontaneous motivation to go to the bar and changed their decision making by becoming a collective. We also observed that the LLM agents did not solve the problem completely, but rather behaved more like humans. These findings reveal a complex interplay between e...
ID: 2509.04537v2 cs.MA, cs.AI, cs.CY
Авторы:

Zheyan Qu, Wenbo Wang, Zitong Yu, Boquan Sun, Yang Li, Xing Zhang

#### Контекст Огромное развитие технологий интеллектуальных систем и многообразие приложений в 6G-сетях расширяют потребность в системах самоорганизации и высокоэффективной коллективной работе. Большие языковые модели (LLM) являются новым инструментом для управления и анализа данных в интеллектуальных сетях. Однако ограниченные ресурсы отдельных устройств сети существенно затрудняют эффективное использование LLM-enabled agents. Кроме того, задачи высокого уровня требуют усовершенствования системы коллективного планирования и распределения задач. Таким образом, необходимо разработать мощную архитектуру, в которой LLM-enabled agents могли бы эффективно координироваться в рамках локальных и глобальных сетевых узлов. #### Метод Предлагается фреймворк LLM-enabled multi-agent system с двухуровневой коллективной работой терминалов и серверов краевых узлов (dual-loop terminal-edge collaboration). Во внешнем кругу (outer loop) взаимодействуют глобальный агент и несколько подчиненных агентов, развернутых на серверах краевых узлов и терминалах. Данная система разбивает задачи на подзадачи, которые распределяются в параллельном режиме. Во внутреннем круге (inner loop) каждый подчиненный агент выполняет циклические операции: принятие решений, выполнение действий и перепланирование. Для повышения эффективности работы включены стратегии параллельного вызова инструментов и оффлоадинга. #### Результаты Выполненное исследование показало, что данная архитектура значительно улучшает как планирование задач, так и их исполнение в рамках 6G-сетей. Эксперименты проводились на сценарии управления городским безопасностью с использованием 6G-технологий. Например, в ситуации с высоким воздействием на территорию, LLM-enabled agents быстро планировали и выполняли необходимые меры, оптимизируя назначение ресурсов и снижая время реакции. #### Значимость Предложенная система LLM-enabled multi-agent system может быть применена в различных областях, включая управление городской инфраструктурой, здравоохранение, энергетику и другие. Основные преимущества включают увеличение эффективности выполнения задач, быстродействие и гибкость в решении задач на динамичных сетях. Развитие таких систем может способствовать успешному переходу к 6G-эпохе с новыми возможностями в области умных сетей. #### Выводы Полученные результаты подтверждают эффективность промышленного применения LLM-enabled multi-agent system в 6G-сетях. Несмотря на продвижение технологий, в будущем необходимо развивать методы более тонкого управления ресурсами, адаптивных алгоритмов и стратегий взаимодействия для улучш
Annotation:
The ubiquitous computing resources in 6G networks provide ideal environments for the fusion of large language models (LLMs) and intelligent services through the agent framework. With auxiliary modules and planning cores, LLM-enabled agents can autonomously plan and take actions to deal with diverse environment semantics and user intentions. However, the limited resources of individual network devices significantly hinder the efficient operation of LLM-enabled agents with complex tool calls, high...
ID: 2509.04993v1 cs.MA, cs.AI
Авторы:

Prathamesh Devadiga, Omkaar Jayadev Shetty, Pooja Agarwal

## Контекст Правосудие является важной компонентой любой системы правосудия, поскольку оно определяет справедливость и эффективность рассмотрения судебных дел. Однако, изучение процесса судебных дебатов и установления эффективности ограничено вызовами юридической, этической и практической природы. Недостаточное понимание судебных дебатов может привести к ошибкам, необоснованным изысканиям и несправедливым решениям. Для решения этих проблем требуется моделирование судебных дебатов, чтобы понять, как судьи, судьи-присяжные и юристы достигают согласия при принятии решений. Одной из таких моделей является **SAMVAD** — система, основанная на многоагентной системе (MAS), которая симулирует процесс судебных дебатов в контексте индийского права. ## Метод **SAMVAD** использует мультиагентную систему, в которой каждый агент представляет собой отдельную роль в судебном процессе: нотариус, защитник, обвинитель и судьи-присяжные. Каждый из них оснащен технологией генерирующих языковых моделей (LLMs), чтобы сгенерировать реалистичные доказательства и споры. Основной компонент — **Retrieval-Augmented Generation (RAG)**, который используется для доступа к документам, таким как Конституция Индии и Уголовный Кодекс. Эта технология позволяет агентам привязывать свои аргументы к закону и представлять доказательства в виде цитирований. На каждом этапе дебатов агенты совершают ряд итераций, обмениваются информацией и принимают решения, основываясь на законных и фактических аргументах. ## Результаты Для проверки эффективности **SAMVAD** были проведены эксперименты, в которых агенты судей, защитников и обвинителей работали вместе над симулированными судебными делами. Использовались тестовые данные, включающие сценарии судебных процессов, чтобы проверить качество генерируемых документов и решений. Результаты показали, что **SAMVAD** способен генерировать доказательства с высоким уровнем точности и юридической значимости. Объемы текста и количество согласий между агентами также были измерены, чтобы оценить качество взаимодействия и принятия решений. ## Значимость **SAMVAD** может применяться в сфере образования для обучения юристов, в сфере юридических исследований для изучения процесса принятия решений, а также в сфере разработки искусственного интеллекта для работы с юридическими проблемами. Одним из основных преимуществ является возможность получить легко проверяемые решения с привязкой к законодательным документам. Это может повысить прозрачность судебного процесса и улучшить уровень доверия к системе правосудия. ## Выводы Основным
Annotation:
Understanding the complexities of judicial deliberation is crucial for assessing the efficacy and fairness of a justice system. However, empirical studies of judicial panels are constrained by significant ethical and practical barriers. This paper introduces SAMVAD, an innovative Multi-Agent System (MAS) designed to simulate the deliberation process within the framework of the Indian justice system. Our system comprises agents representing key judicial roles: a Judge, a Prosecution Counsel, a ...
ID: 2509.03793v1 cs.MA, cs.AI
Авторы:

Costin Bădică, Amelia Bădică, Maria Ganzha, Mirjana Ivanović, Marcin Paprzycki, Dan Selişteanu, Zofia Wrona

## Контекст Область исследования сосредоточена на современных агентных технологиях, которые развиваются в сторону использования Large Language Models (LLM) и классических Multi-Agent Systems (MAS). Лингвистические модели LLM, такие как GPT-4, обладают высоким уровнем глубины анализа текста и языкового понимания, что позволяет имитировать человеческую речь и выполнять сложные задачи. Однако, классические MAS, основанные на базовых принципах самоорганизации, координации и коммуникации между агентами, продолжают быть ключевым инструментом для автоматизации и систем управления. Эта статья охватывает сравнительный анализ LLM-driven advancements и MAS, с целью выявить сходства, различия, а также идентифицировать области, где эти технологии могут дополнять друг друга. ## Метод Методология исследования включает обобщающий обзор литературы, технический анализ существующих решений, а также создание моделей для сравнения. Архитектура рассматриваемых систем построена на основе объектно-ориентированных принципов, с учетом специфики LLM-движков (например, генерации текста при помощи LLMs) и классических методов MAS, таких как распределенные агентные сети и алгоритмы координации. Ключевые технические решения включают интеграцию LLM в существующие MAS, а также разработку гибридных парадигм, которые объединяют лучшие качества LLM и MAS. Такой подход позволяет использовать мощь глубокого анализа текста LLM для упрощения процессов координации и принятия решений в системах MAS. ## Результаты Эксперименты были проведены на двух наборах данных: текстовые данные для обучения моделей LLM и сетевые данные для моделирования MAS. Модели LLM были оценены по метрикам точности генерации текста и уровню понимания задач. MAS были оценены по ключевым показателям, таким как эффективность координации и устойчивость к различным сценариям использования. Результаты показали, что LLM могут значительно улучшить процесс генерации решений и упростить моделирование сложных ситуаций. Однако, MAS показали высокую эффективность в управлении распределенными системами, где необходимость в реальном времени и масштабируемость являются ключевыми факторами. ## Значимость Полученные результаты имеют значительное значение для различных областей, включая управление, интеллектуальные системы, системы мониторинга и управления сложными системами. LLM-driven advancements могут существенно улучшить процесс принятия решений в ситуациях, где требуется высокая точность и понимание контекста. MAS, свою очередь, предоставляют решения для управления распределенными и многоуровневыми системами. Гибридные парадигмы могу
Annotation:
This contribution provides our comprehensive reflection on the contemporary agent technology, with a particular focus on the advancements driven by Large Language Models (LLM) vs classic Multi-Agent Systems (MAS). It delves into the models, approaches, and characteristics that define these new systems. The paper emphasizes the critical analysis of how the recent developments relate to the foundational MAS, as articulated in the core academic literature. Finally, it identifies key challenges and ...
ID: 2509.02515v1 cs.MA, cs.AI, 68Txx, I.2
Авторы:

Arnau Quera-Bofarull, Nicholas Bishop, Joel Dyer, Daniel Jarne Ornia, Anisoara Calinescu, Doyne Farmer, Michael Wooldridge

## Контекст Агентно-ориентированные модели (ABM) широко используются для моделирования сложных систем, таких как эпидемии, финансовые рынки и социальные системы. Они представляют собой системы, в которых индивидуальные агенты взаимодействуют друг с другом по низкоуровневым правилам, образуя сложные поведенческие характеристики. Однако существуют серьезные проблемы с их использованием. В частности, ABMs требуют калибровки многих параметров, что требует больших вычислительных ресурсов и усилий. Дополнительно, обратная оптимизация в ABMs, такая как вариационный инференс (VI), требует частого вычисления градиентов модели, что добавляет сложности. Эти ограничения ограничивают применение ABMs в практических задачах. В этой статье мы рассматриваем, как технологии автоматической дифференциации (AD) могут решить эти проблемы и упростить применение ABMs. ## Метод Мы применяем технологию автоматической дифференциации (AD) для получения градиентов агентно-ориентированных моделей. AD — это метод, который автоматически вычисляет градиенты функций, относительно своих аргументов, используя частные производные. В нашем случае, AD применяется к моделированию систем, где градиенты используются для оптимизации параметров и вариационного инференса. Мы реализуем AD в сочетании с методом опорных векторов (SVI) для эффективного калибровки параметров. Эта комбинация позволяет решить задачи вычисления градиентов в значительно меньшем объеме вычислительных ресурсов, чем при использовании стандартных методов. ## Результаты Мы провели эксперименты с применением AD к трем известным агентно-ориентированным моделям: Axtell's model of firms, Sugarscape и SIR-модели. Наши эксперименты показали, что применение AD с SVI существенно сокращает время расчета градиентов и улучшает точность калибровки. В сравнении с традиционными методами, такими как finite difference, AD демонстрирует значительные выигрыши в скорости и точности вычислений. Например, в модели Sugarscape, AD позволил уменьшить время расчета градиентов в несколько раз, что увеличило эффективность процесса калибровки параметров. ## Значимость Полученные результаты открывают новые перспективы для применения ABMs в сложных системах. Автоматическая дифференциация упрощает и ускоряет процесс калибровки параметров, что делает ABMs более доступными для применения в практике. Эта технология может быть применена в различных областях, включая экономику, эпидемиологию и управление рисками. Благодаря AD, ABMs становятся более масштабируемыми и могут обрабатывать большие объемы данных, что позволяет исследовать более сложные системы. Это открывает пути для прогнозировани
Annotation:
Agent-based models (ABMs) simulate complex systems by capturing the bottom-up interactions of individual agents comprising the system. Many complex systems of interest, such as epidemics or financial markets, involve thousands or even millions of agents. Consequently, ABMs often become computationally demanding and rely on the calibration of numerous free parameters, which has significantly hindered their widespread adoption. In this paper, we demonstrate that automatic differentiation (AD) tech...
ID: 2509.03303v1 cs.MA, cs.AI, cs.CE, cs.LG
Авторы:

Vincent E. Castillo

## Контекст Generative Agent-Based Models (GABMs), основанные на больших языковых моделях (LLMs), представляют собой перспективный инструмент для исследований в области логистики и управления цепями поставок (LSCM). Они могут гибко и реалистично моделировать человеческое поведение благодаря применению естественного языка. Тем не менее, неясно, насколько эти модели эффективно воспроизводят реальность и могут заменить классические методы исследования. Эта проблема начинает приобретать важность в свет роста интереса к искусственному интеллекту в задачах, требующих реалистичных симуляций. В этом контексте возникает необходимость проверки того, насколько хорошо GABMs могут эмпирически описывать логистические ситуации, а также выявление потенциальных проблем в их методологии. ## Метод Для проверки GABMs была применена управляемая экспериментальная модель, в которой участники (477 диадных пар) решали задачи в сценарии доставки питания. Для сравнения использовались шесть современных LLMs, которые выступали в роли симулируемых агентов. Использованный подход включал моделирование диалогов, анализ решений и использование метода структурного эквивалентности (structural equivalence) для оценки того, насколько GABMs согласовываются с реальным поведением. Также в эксперименте были использованы значимые условия и структурная модель (structural equation modeling, SEM), чтобы изучить решаемость и эквивалентность решений. ## Результаты Эксперимент показал, что некоторые LLMs могут эффективно эмулировать поведение людей в задачах доставки питания, при этом другие LLMs демонстрировали решаемость, но с отклонениями в решениях, не соответствующими реальному поведению. Например, ряд тестов на эквивалентность (Two One-Sided Tests, TOST) показал, что некоторые LLMs согласовывались с реальным поведением на поверхностном уровне, но структурные модели показали, что некоторые LLMs генерировали решательные процессы, отличные от тех, что присутствовали у участников. Это значит, что GABMs могут стать полезным инструментом, но их требуется проверить с точки зрения эмуляции и решательных процессов. ## Значимость Результаты имеют практическое значение для логистики и LSCM, поскольку они показывают, что GABMs могут быть применены для симуляции логистических ситуаций, но необходимо проводить две основные проверки: эмуляция поведения и проверка решательных процессов. Это также может быть полезно для разработчиков, которые используют LLMs в логистических решениях, так как оно дает рекомендации по выбору LLMs, основанные на реальных данных. Будущие исследования должны сосредоточиться на улучшении этих проверок, чтобы сделать GABMs более надёжными и реалистич
Annotation:
Generative Agent-Based Models (GABMs) powered by large language models (LLMs) offer promising potential for empirical logistics and supply chain management (LSCM) research by enabling realistic simulation of complex human behaviors. Unlike traditional agent-based models, GABMs generate human-like responses through natural language reasoning, which creates potential for new perspectives on emergent LSCM phenomena. However, the validity of LLMs as proxies for human behavior in LSCM simulations is ...
ID: 2508.20234v1 cs.MA, cs.AI, cs.CY
Показано 91 - 100 из 117 записей