📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Simin Li, Zihao Mao, Hanxiao Li, Zonglei Jing, Zhuohang bian, Jun Guo, Li Wang, Zhuoran Han, Ruixiao Xu, Xin Yu, Chengdong Ma, Yuqing Ma, Bo An, Yaodong Yang, Weifeng Lv, Xianglong Liu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
In cooperative Multi-Agent Reinforcement Learning (MARL), it is a common practice to tune hyperparameters in ideal simulated environments to maximize cooperative performance. However, policies tuned for cooperation often fail to maintain robustness and resilience under real-world uncertainties. Building trustworthy MARL systems requires a deep understanding of robustness, which ensures stability under uncertainties, and resilience, the ability to recover from disruptions--a concept extensively s...
ID: 2510.11824v1 cs.MA, cs.AI, cs.LG
Авторы:

Promise Osaine Ekpo, Brian La, Thomas Wiener, Saesha Agarwal, Arshia Agrawal, Gonzalo Gonzalez-Pumariega, Lekan P. Molu, Angelique Taylor

## Контекст В области мульти-агентного обучения с подкреплением (MARL) важность создания систем, обеспечивающих справедливость и эффективность, несомненна. В работе акцент делается на значимости справедливости в контексте медицинских систем, где необходимо сбалансировать рабочую нагрузку и учитывать уровень экспертизы медицинских работников. В ситуациях, где недостаточно внимания уделяется навыкам и экспертизе, возможны загруженность опытных специалистов и их перегрузка, что может привести к усталости и ухудшению качества услуг. Текущие метрики справедливости часто ориентированы только на равномерное распределение нагрузки, не учитывая уровень навыков и знаний сотрудников. Таким образом, авторы статьи поставили перед собой задачу разработать метод, который учитывал бы взаимосвязь уровня навыков и распределения задач. ## Метод Авторы представили **FairSkillMARL**, рамфреймворк, определяющий справедливость как двойной объектив: равномерное распределение нагрузки и корректное соотнесение навыков и задач. Метод использует методы агентного обучения с подкреплением, чтобы сбалансировать вклад каждого агента, учитывая их экспертизу. Также был разработан **MARLHospital**, полностью настраиваемая среда, которая моделирует работу медицинского коллектива, учитывая знания и энергосбережение. Эта модель позволяет анализировать различные сценарии взаимодействия медицинских работников, включая зависимость задач от уровня их навыков. Эта инновационная модель позволяет лучше понять, как различные стратегии мульти-агентного обучения влияют на справедливость и эффективность в коллективе. ## Результаты Авторы провели эксперименты, сравнивая **FairSkillMARL** с четырьмя стандартными MARL-методами и двумя метриками справедливости. Они показали, что стратегии, основывающиеся только на равномерном распределении задач, могут привести к несоответствию между навыками и задачами, что в свою очередь приводит к ухудшению качества работы. Метод **FairSkillMARL** демонстрирует эффективность в снижении таких несоответствий и способствует созданию более гармоничного распределения нагрузки в зависимости от уровня навыков и экпертизы сотрудников. Это приводит к более эффективной работе коллектива и снижению истощения опытных работников. ## Значимость Предложенный подход имеет широкие применения в сфере медицины, где требуется эффективное и справедливое распределение задач между специалистами. Особенно он важен для ситуаций, где нужна энергосберегающая стратегия и высокий уровень экспертизы, чтобы избежать перегрузки опытных работников. **FairSkillMARL**
Annotation:
Fairness in multi-agent reinforcement learning (MARL) is often framed as a workload balance problem, overlooking agent expertise and the structured coordination required in real-world domains. In healthcare, equitable task allocation requires workload balance or expertise alignment to prevent burnout and overuse of highly skilled agents. Workload balance refers to distributing an approximately equal number of subtasks or equalised effort across healthcare workers, regardless of their expertise. ...
ID: 2508.18708v1 cs.MA, cs.AI, cs.LG
Авторы:

Xiaodong Qu, Andrews Damoah, Joshua Sherwood, Peiyan Liu, Christian Shun Jin, Lulu Chen, Minjie Shen, Nawwaf Aleisa, Zeyuan Hou, Chenyu Zhang, Lifu Gao, Yanshu Li, Qikai Yang, Qun Wang, Cristabelle De Souza

#### Контекст Современные искусственные интеллектуальные системы (AI agents) представляют собой сложные системы, которые способны переменоваться, учиться и действовать в различных сложных средах. Они превратились из простых, правил-ориентированных программ в современные системы, использующие глубокое обучение (deep learning), усиленное обучение (reinforcement learning) и методы многоагентного взаимодействия. Несмотря на то, что эти технологии позволяют AI agents выполнять сложные задачи, создание универсальных AI agents, где взаимодействуют решение, планирование и взаимодействие, остается вызовом. Эта статья посвящена изучению основных принципов, моделей и парадигм, которые способствуют развитию AI agents, а также их использования в реальных ситуациях. #### Метод В статье используется систематический подход к изучению архитектур, компонентов и парадигм AI agents. Был проведен анализ современных моделей, включая модели вдохновленные искусственной интеллектуальной моделью (cognitive science-inspired models), расширенные резервирующие решения (hierarchical reinforcement learning frameworks) и модели базированные на больших языковых моделях (large language model-based reasoning). Был осуществлен анализ технологий вычислений, которые позволяют AI agents решать задачи, взаимодействуя с системами и пользователями. Особое внимание уделяется архитектуре и методам, позволяющим AI agents оптимально решать задачи в разных сценариях. #### Результаты Для анализа использовались различные эксперименты, включая моделирование AI agents в различных ситуациях, таких как обнаружение объектов, решение задач планирования, взаимодействие с пользователями. Использовались данные, полученные из реальных ситуаций, таких как обработка данных в интеллектуальных системах, решение задач планирования как в средах с многими участниками. Результаты показывают, что AI agents способны выполнять сложные задачи с высокой точностью, но в то же время существуют проблемы, такие как неполная интерпретируемость, безопасность и эффективность в реальных ситуациях. #### Значимость AI agents имеют широкое применение в различных областях, включая здравоохранение, финансы, производство, транспорт и многие другие. Они могут повысить эффективность, сократить затраты и улучшить качество услуг. Основное преимущество AI agents заключается в их универсальности, гибкости и умении решать сложные задачи. Тем не менее, возникают проблемы, такие как недостаточная интерпретация решений, отсутствие безопасности и надежности. Будущие исследования будут сфокусированы на улучшении этих аспектов и развитии AI agents, которые будут более безопасными, эффективными и интерпретируемыми. #### Выводы В ходе этого обзора были подробно расс
Annotation:
Artificial Intelligence (AI) agents have rapidly evolved from specialized, rule-based programs to versatile, learning-driven autonomous systems capable of perception, reasoning, and action in complex environments. The explosion of data, advances in deep learning, reinforcement learning, and multi-agent coordination have accelerated this transformation. Yet, designing and deploying unified AI agents that seamlessly integrate cognition, planning, and interaction remains a grand challenge. In this ...
ID: 2508.11957v1 cs.MA, cs.AI, cs.LG
Авторы:

Akshay Dodwadmath, Setareh Maghsudi

Задача установления справедливых лидеров в средах с множеством агентов, активно обсуждается в мультиагентном расширенном рейнфорсментном обучении (MARL). Традиционные Stackelberg-игры предполагают, что каждый этап игры заключается в действиях лидера, после чего следуют реакции слейвов. Однако выбор лидера может привести к несправедливости в ситуациях, где роль лидера и слейва меняется. Авторы показали, что установление лидера исходя из автоматического выделения лидера может привести к несправедливости в результатах. Для решения этой проблемы предложено интегрировать медиаторов (mediators) в среду мультиагентного лидер-слейв-мультиагентного расширенного рейнфорсментного обучения. Медиаторы могут управлять процессом действий лидеров в лидер-слейв-ситуации, где лидер выбирается на основе максимального уровня справедливости. Это решение позволяет максимизировать справедливость вознаграждений всех агентов, что приводит к справедливым результатам в целом.
Annotation:
Stackelberg games and their resulting equilibria have received increasing attention in the multi-agent reinforcement learning literature. Each stage of a traditional Stackelberg game involves a leader(s) acting first, followed by the followers. In situations where the roles of leader(s) and followers can be interchanged, the designated role can have considerable advantages, for example, in first-mover advantage settings. Then the question arises: Who should be the leader and when? A bias in the ...
ID: 2508.02421v1 cs.MA, cs.AI, cs.LG
Авторы:

Brennen A. Hill, Mant Koh En Wei, Thangavel Jishnuanandh

**Резюме** В данной работе рассматривается сравнение инженерного подхода к коммуникации (Engineered Communication) с инструментом под названием Learned Direct Communication (LDC) в рамках кооперативной многоагентной оркестрации задач в частично наблюдаемых средах. Инженерный подход включает в себя модель Imagined Trajectory Generation Module (ITGM) и Message Generation Network (MGN), которые формируют сообщения на основе прогнозированных будущих состояний. Исследование проводилось на задачах с различным уровнем сложности и видов наблюдаемости. Основным выводом является то, что инженерный подход демонстрирует более высокую эффективность и масштабируемость по сравнению с инструментом LDC. Это открытие показывает, что дизайн коммуникационных стратегий может опередить подходы, основанные на научном исследовании, в сложных, многоагентных средах.
Annotation:
We compare the efficacy of learned versus engineered communication strategies in a cooperative multi-agent reinforcement learning (MARL) environment. For the learned approach, we introduce Learned Direct Communication (LDC), where agents generate messages and actions concurrently via a neural network. Our engineered approach, Intention Communication, employs an Imagined Trajectory Generation Module (ITGM) and a Message Generation Network (MGN) to formulate messages based on predicted future stat...
ID: 2508.02912v1 cs.MA, cs.AI, cs.LG, cs.SY, eess.SY, 68T42, 68T05, 90C40, 93E35, 68T07, I.2.11; I.2.6; I.2.8
Показано 11 - 15 из 15 записей