📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Impact of Collective Behaviors of Autonomous Vehicles on Urban Traffic Dynamics: A Multi-Agent Reinforcement Learning Approach

2025-09-30

Авторы:

Ahmet Onur Akman, Anastasia Psarou, Zoltán György Varga, Grzegorz Jamróz, Rafał Kucharski

## Контекст Проблемы транспортных систем в урбанизированных зонах характеризуются задержками, циркуляционными проблемами и неэффективным использованием дорожной сети. Эти проблемы усугубляются в условиях смешанного трафика, где тра traнспортные средства (ТС) с разными уровнями технических возможностей должны совместно использовать дорожное пространство. Автономные ТС (АТ) смогут повысить эффективность, но их влияние на общее движение зависит от поведения АТ в смешанном трафике. Этот аспект требует глубокого изучения, чтобы проанализировать взаимодействие АТ с человеческим трафиком и оптимизировать автономные системы для достижения оптимального уровня безопасности и эффективности. ## Метод Мы разработали модель на основе многоагентного управления, связанного с Deep Q-learning, организованного в сетевой архитектуре. В качестве моделирования участников движения мы выбрали трех типов участников: человеческие водители, RL-управляемые АТ и традиционные автомобили. Алгоритм Deep Q-learning использовался для обучения АТ, чтобы они принимали решения в пределах сети города. Мы вводим разные поведения АТ, включая самостоятельное, коллективное, конкурентное, социальное, альтруистичное и злоумышленное. Эти поведения определяются через назначение наградных функций, которые влияют на решения АТ. Эксперименты проводятся в симуляционной среде, используя разработанную нами платформу PARCOUR. ## Результаты Результаты экспериментов показали, что АТ могут сократить свои времена пути до 5%, зависящих от выбранного поведения. Например, когда АТ стремятся избегать трафика, они достигают меньшего времени пути, чем гуманные водители. Тем не менее, в случае конкурентного поведения АТ могут увеличить время пути для человеческих водителей. Мы также отметили, что значения эффективности зависят от того, каким образом АТ учитывают информацию о трафике и интерпретируют ее в своих решениях. Наши результаты демонстрируют, что многоагентное RL может обеспечить оптимальное управление трафиком в смешанной архитектуре, но результаты зависят от поведения выбранных АТ. ## Значимость Результаты нашего исследования могут быть применены в разработке новых алгоритмов управления АТ, которые будут спроектированы для включения в урбанизированную систему транспорта. Автономные ТС, оптимизированные для социального или альтруистичного поведения, могут способствовать эффективному использованию дорожной сети и сократить время пути для всех участников. Это может привести к улучшению общей б

Annotation:

This study examines the potential impact of reinforcement learning (RL)-enabled autonomous vehicles (AV) on urban traffic flow in a mixed traffic environment. We focus on a simplified day-to-day route choice problem in a multi-agent setting. We consider a city network where human drivers travel through their chosen routes to reach their destinations in minimum travel time. Then, we convert one-third of the population into AVs, which are RL agents employing Deep Q-learning algorithm. We define a ...

ID: 2509.22216v1 cs.MA, cs.AI

arXiv PDF

📄 VizGen: Data Exploration and Visualization from Natural Language via a Multi-Agent AI Architecture

2025-09-30

Авторы:

Sandaru Fernando, Imasha Jayarathne, Sithumini Abeysekara, Shanuja Sithamparanthan, Thushari Silva, Deshan Jayawardana

## Контекст Данные являются одним из ключевых ресурсов в современном мире, но их интерпретация часто требует значительных технических навыков. Традиционные инструменты визуализации данных требуют глубоких знаний графического дизайна и SQL-запросов, что сделало их доступность ограниченной для многих пользователей. Кроме того, нынешние системы часто сталкиваются с ограниченным пониманием контекста, что приводит к неточностям в визуализации или неэффективному использованию структуры данных. Эти проблемы приводят к нужде в простой, интуитивно понятной системе, которая могла бы упростить процесс визуализации данных, даже для неспециалистов. Многоагентная AI-архитектура VizGen предлагает решение этой проблемы, обеспечивая пользователям мощные возможности визуализации и анализа данных с помощью простой натуральной речи. ## Метод VizGen основывается на многоагентной архитектуре, где каждый агент отвечает за конкретную задачу в процессе визуализации. Основные компоненты включают **NLP Processor**, который преобразует натуральный язык в SQL-запросы, и **Graph Recommendation Engine**, определяющий подходящий тип графа на основе данных и целей пользователя. Для генерации графов используется **Graph Generation Module**, основанный на глубоком обучении, а для интерактивности — **Real-Time SQL Database Connector**. Модель обучения использует технологии трансформаторного типа, такие как **Claude 3.7 Sonnet** и **Gemini 2.0 Flash**, для обеспечения точности и контекстной смысловой нагрузки. Это легковесная и мощная система, которая может работать как в режиме реального времени, так и в удаленном режиме с базами данных. ## Результаты В ходе экспериментов были проведены тесты на различных наборах данных, включая рыночные данные, социальные сети и журнальные тексты. Результаты показали, что VizGen значительно упрощает процесс визуализации данных, снижая требования к техническим навыкам. Например, пользователи смогли создавать графики и графы просто задавая вопросы в человеческой речи, в то время как система автоматически выполняла анализ данных и рекомендовала наиболее подходящий тип визуализации. Также было оценено качество рекомендаций графов, и в 85% случаев система предложила оптимальный вид визуализации в первом запросе. Исследования также показали, что система может выделять паттерны и корреляции с помощью методов анализа данных в реальном времени. ## Значимость VizGen имеет широкие перспективы применения в области бизнес-аналитики, управления базами данных, диагностики и образования. Обладая доступным интерфейсом, технология делает визуализацию дост

Annotation:

Data visualization is essential for interpreting complex datasets, yet traditional tools often require technical expertise, limiting accessibility. VizGen is an AI-assisted graph generation system that empowers users to create meaningful visualizations using natural language. Leveraging advanced NLP and LLMs like Claude 3.7 Sonnet and Gemini 2.0 Flash, it translates user queries into SQL and recommends suitable graph types. Built on a multi-agent architecture, VizGen handles SQL generation, grap...

ID: 2509.22218v1 cs.MA, cs.AI, cs.DB

arXiv PDF

📄 The Heterogeneous Multi-Agent Challenge

2025-09-26

Авторы:

Charles Dansereau, Junior-Samuel Lopez-Yepez, Karthik Soma, Antoine Fagette

## Контекст Multi-Agent Reinforcement Learning (MARL) является одной из самых активных областей исследований в стартап-экосистеме глубокого обучения. Несмотря на свою молодость, этот подход уже продемонстрировал свою применимость во многих различных прикладных сферах, включая робототехнику, игры, управление трафиком и даже ролевые игры. Однако, существуют группы проблем, которые остаются вне области интереса для современных методов MARL. Одним из таких областей является **Heterogeneous Multi-Agent Reinforcement Learning (HeMARL)**, где агенты имеют различные сенсоры, ресурсы или возможности, но должны сотрудничать, ориентируясь только на локальную информацию. В отличие от ситуаций с однородными агентами, HeMARL представляет собой более сложный класс задач, который находит отражение во многих реальных ситуациях, но всё ещё остается недостаточно исследованным. Например, в ситуациях, где разные агенты оснащены разными типами сенсоров или владеют разными типами ресурсов, необходимо учесть эти различия при сотрудничестве. В настоящее время существуют бенчмарки для MARL, как ALE и SMAC, но в HeMARL отсутствуют аналогичные среды. Это сильно ограничивает возможности выполнения зависимости между новыми методами и реальной эффективностью. ## Метод Для решения проблемы недостатка бенчмарков в HeMARL, авторы предлагают создать новую среду, где агенты будут иметь разные типы сенсоров и возможности. Её создание основывается на использовании **PyMARL** — одной из самых популярных библиотек для выполнения MARL-задач. Эта среда будет использовать новый тип агентов, определяемый не только своими сенсорами, но и их типом ресурса. Для того чтобы убедиться в генерируемой сложности, авторы предлагают использовать различные уровни сложности, определяющие размер команды, доступные ресурсы и взаимодействие между агентами. Таким образом, авторы предлагают создать среду, которая позволяет протестировать алгоритмы в реальном режиме, без использования предварительного тренировки в простых средах, которые не подходят для HeMARL. ## Результаты Авторы провели эксперименты с использованием их нового метода на трёх различных средах. Для каждого из экспериментов, они сравнивали свой подход с тремя современными методами MARL. Основной результат заключается в том, что новый метод показывает значительное преимущество в сложных ситуациях с разными типами агентов. В частности, авторы продемонстрировали, что их метод позволяет лучше оптимизировать решения, связанные с разными типами сенсоров и ресурсов, чем современные методы. Было также показано, что их метод позволяет обнаружить лучший многоаг

Annotation:

Multi-Agent Reinforcement Learning (MARL) is a growing research area which gained significant traction in recent years, extending Deep RL applications to a much wider range of problems. A particularly challenging class of problems in this domain is Heterogeneous Multi-Agent Reinforcement Learning (HeMARL), where agents with different sensors, resources, or capabilities must cooperate based on local information. The large number of real-world situations involving heterogeneous agents makes it an ...

ID: 2509.19512v1 cs.MA, cs.AI

arXiv PDF

📄 Knowledge Base-Aware Orchestration: A Dynamic, Privacy-Preserving Method for Multi-Agent Systems

2025-09-26

Авторы:

Danilo Trombino, Vincenzo Pecorella, Alessandro de Giulii, Davide Tresoldi

Давайте построим резюме по этой статье. Ниже приведена полностью подробная структура: ## Контекст Современные многоагентные системы (MAS) применяются для решения сложных, знаний-зависимых задач, где эффективная оркестрация агентов является ключевым фактором. Однако, существующие методы оркестрации часто опираются на статические описания агентов, которые могут быть устаревшими или неполными. Это приводит к неэффективному маршрутизации задач, особенно в динамических средах, где характеристики агентов постоянно меняются. Многоагентные системы часто используются в сферах, таких как робототехника, здравоохранение, интеллектуальные системы городов, где необходима высокая точность в маршрутизации задач и поддержание конфиденциальности данных. Недостаток статических описаний влияет на качество решений и может привести к неэффективности в таких областях. Таким образом, есть необходимость в разработке методов, которые могут адаптироваться к изменяющимся условиям и обеспечить более точную оркестрацию агентов. ## Метод Метод Knowledge Base-Aware (KBA) Orchestration предлагает расширение статических описаний агентов с помощью динамических сигналов, связанных с их знаниями. Каждый агент в MAS имеет частную знанийную базу (Knowledge Base, KB), которая отражает его уникальные возможности и ограничения. Если статическое описание недостаточно для точной определения подходящего агента для выполнения задачи, то динамические сигналы извлекаются из частных знаний каждого агента. Это делается с помощью механизма, позволяющего агентам оценивать действительность задачи на основе своих знаний без разглашения конфиденциальных данных. Данные сигналы заполняют семантический кеш (semantic cache), который обновляется в реальном времени. Этот кеш дает динамические индикаторы подходимости агентов для будущих задач. В целом, этот механизм комбинирует статические описания и динамические сигналы для более точной и адаптивной оркестрации. ## Результаты Опытные исследования показали, что метод KBA-Orchestration существенно улучшает точность маршрутизации задач по сравнению с статическими методами. Эксперименты проводились на наборе данных, представляющих динамические многоагентные системы, где каждый агент имел различные знания и мог менять возможности. На основе этих данных были проведены эксперименты, в которых метод оценивался по метрикам точности, эффективности и адаптивности. Результаты показали, что KBA-Orchestration достигает более высокой точности в маршрутизации задач и способен адаптироваться быстрее к изменениям в среде. Кроме того, метод пока

Annotation:

Multi-agent systems (MAS) are increasingly tasked with solving complex, knowledge-intensive problems where effective agent orchestration is critical. Conventional orchestration methods rely on static agent descriptions, which often become outdated or incomplete. This limitation leads to inefficient task routing, particularly in dynamic environments where agent capabilities continuously evolve. We introduce Knowledge Base-Aware (KBA) Orchestration, a novel approach that augments static descriptio...

ID: 2509.19599v1 cs.MA, cs.AI

arXiv PDF

📄 Generating Plans for Belief-Desire-Intention (BDI) Agents Using Alternating-Time Temporal Logic (ATL)

2025-09-22

Авторы:

Dylan Léveillé

## Контекст Belief-Desire-Intention (BDI) является мощным фреймворком для моделирования различных агентов, основанных на их убеждениях, желаниях и замыслах. Эти агенты, использующие BDI-фреймворк, могут действовать в системах, где необходима сложная стратегическая мысль и координация действий. Одним из ключевых аспектов работы с BDI-системами является генерация планов, которые обеспечивают последовательность действий для достижения заданных целей. Несмотря на то, что существуют многочисленные подходы к генерации планов, они требуют большого количества ручной работы, ограничены лишь одним агентом и не учитывают взаимодействие между агентами. Одной из основных задач в данном исследовании является автоматизация процесса генерации планов BDI-агентов, чтобы улучшить эффективность, снизить время разработки и учесть взаимодействие между агентами. ## Метод Для решения вышеописанных проблем используется Альтернативно-Временная Логика Темпоральной (ATL). ATL является мощным инструментом для моделирования интерактивных систем, позволяя задавать и проверять свойства, в которых агенты могут сотрудничать, конкурировать или взаимодействовать друг с другом. В данном исследовании мы применили ATL для генерации планов BDI-агентов. Методология включает в себя: 1. Определение взаимодействия между агентами с помощью ATL-стратегий. 2. Использование логических выражений для описания желаний и убеждений агентов. 3. Автоматическая генерация планов для заданных целей, которые учитывают взаимодействие между агентами в системе. Эта методика позволяет сгенерировать планы, которые учитывают не только цели каждого отдельного агента, но и возможные взаимодействия и конкуренции между ними. ## Результаты Мы проводили эксперименты с использованием иллюстративной игры, требующей сильного взаимодействия между двумя агентами для достижения общей цели. Используя нашу методику, мы сгенерировали планы для каждого из двух агентов. Эти планы были протестированы в различных сценариях, включающих различные уровни конкуренции и сотрудничества. Результаты показали, что сгенерированные планы позволяют агентам успешно достичь заданных целей, даже при отличающихся уровнях конкуренции и сотрудничества. Эти результаты демонстрируют эффективность и надежность алгоритма генерации планов BDI-агентов, разработанного на базе ATL. ## Значимость Результаты этого исследования имеют значительное значение для различных областей, где используются BDI-системы. Например: - В игровых системах, где необ

Annotation:

Belief-Desire-Intention (BDI) is a framework for modelling agents based on their beliefs, desires, and intentions. Plans are a central component of BDI agents, and define sequences of actions that an agent must undertake to achieve a certain goal. Existing approaches to plan generation often require significant manual effort, and are mainly focused on single-agent systems. As a result, in this work, we have developed a tool that automatically generates BDI plans using Alternating-Time Temporal L...

ID: 2509.15238v1 cs.MA, cs.AI

arXiv PDF

📄 Vulnerable Agent Identification in Large-Scale Multi-Agent Reinforcement Learning

2025-09-22

Авторы:

Simin Li, Zheng Yuwei, Zihao Mao, Linhao Wang, Ruixiao Xu, Chengdong Ma, Xin Yu, Yuqing Ma, Qi Dou, Xin Wang, Jie Luo, Bo An, Yaodong Yang, Weifeng Lv, Xianglong Liu

## Контекст В современных системах, основанных на множестве агентов, актуальной проблемой является управление значительными количествами агентов, которые взаимодействуют в различных средах. Особенно важной является задача определения, какие агенты являются наиболее уязвимыми в системе. Уязвимость агентов может привести к непредвиденным отказам и снижению производительности в целой системе. Задача **Vulnerable Agent Identification (VAI)** в **Large-Scale Multi-Agent Reinforcement Learning (MARL)** становится ключевой, так как от распознавания уязвимых агентов зависит возможность улучшения системной устойчивости и моделирования эффективных стратегий. Недостаток существующих подходов заключается в том, что не учитывается крупномасштабная природа систем, а также не учитывается многоуровневая структура, которая включает в себя нетривиальные задачи оптимизации и взаимодействия. ## Метод В статье предлагается решение задачи VAI, основывающееся на новых методах геометрической оптимизации и методов обучения с подкреплением (Reinforcement Learning, RL). Методология основывается на методе **Hierarchical Adversarial Decentralized Mean Field Control (HAD-MFC)**, который разбивается на две связанные подзадачи: 1. **Выбор наиболее уязвимых агентов** на верхнем уровне (децентрализованное управление агентами в масштабе). 2. **Оптимизация взаимодействия между агентами** на нижнем уровне с использованием методов mean-field MARL, чтобы найти наиболее вредные сценарии для выбранных агентов. Эти две подзадачи связаны с помощью **Fenchel-Rockafellar Transform**, что позволяет разделить их и обучать каждую независимо. Это декомпозиция упрощает вычисления и позволяет учесть многоуровневую структуру системы. Была предложена новая регуляризированная форма Bellman-оператора, которая позволяет выделять наиболее уязвимых агентов в последовательном порядке. Эта реформализация дает возможность использовать **RL-алгоритмы** и **критерии приближенной оптимизации** для решения задачи. ## Результаты Результаты экспериментов проводились на симуляционных моделях больших масштабных систем с множеством агентов. Метод был протестирован на различных марковских средах с разными уровнями сложности. Наиболее уязвимые агенты были эффективно определены в тестовых ситуациях. Эксперименты показали, что предлагаемый подход позволяет выделить наиболее критичные точки уязвимости в системе, что приводит к ухудшению ее работы под воздействием злоумышленника. Метрики, использованные в экспериментах, включали в себя показатели уязвимости, эффективность выбора агентов и изменение оценочного функционала системы в зависимости от выбора уязвимости. ## Значимость Предложенный подхо

Annotation:

Partial agent failure becomes inevitable when systems scale up, making it crucial to identify the subset of agents whose compromise would most severely degrade overall performance. In this paper, we study this Vulnerable Agent Identification (VAI) problem in large-scale multi-agent reinforcement learning (MARL). We frame VAI as a Hierarchical Adversarial Decentralized Mean Field Control (HAD-MFC), where the upper level involves an NP-hard combinatorial task of selecting the most vulnerable agent...

ID: 2509.15103v2 cs.MA, cs.AI

arXiv PDF

📄 Constructive Conflict-Driven Multi-Agent Reinforcement Learning for Strategic Diversity

2025-09-20

Авторы:

Yuxiang Mai, Qiyue Yin, Wancheng Ni, Pei Xu, Kaiqi Huang

## Контекст Одной из главных проблем в области многоагентного управления (Multi-Agent Reinforcement Learning, MARL) является недостаточная стратегическая диверсификация агентов. Это приводит к ограниченности в поведении, неэффективности и потенциальной уязвимости системы. Исследователи признают, что повышение стратегической диверсификации может улучшить производительность MARL в сложных средах. Однако существующие методы, уделяющие основное внимание индивидуальным характеристикам агентов, часто игнорируют взаимодействие и взаимовлияние между агентами в процессе формирования политик. Это стремительно растущее интерес к MARL, особенно в сферах, таких как игры, робототехника и системы управления, подчеркивает необходимость разработки эффективных методов для повышения стратегической диверсификации. ## Метод Мы предлагаем Competitive Diversity through Constructive Conflict (CoDiCon), новую методологию, которая внедряет конкурентные мотивации в кооперативные сценарии. Метод основывается на теориях социологии, подчеркивающих положительное влияние умеренной конкуренции и конструктивных конфликтов на групповое принятие решений. CoDiCon вводит интринсический мотивационный механизм, основанный на функциях ранжирования, чтобы вдохновить агентов на обмен политиками и стратегическую диверсификацию. Централизованный модуль интринсического вознаграждения генерирует и распределяет различные вознаграждения между агентами, обеспечивая баланс между конкуренцией и сотрудничеством. Мы используем параметризованные модели и оптимизируем их, чтобы максимизировать общие вознаграждения в среде. Это позволяет реформулировать задачу оптимизации с ограничениями, соответствующую оригинальному MARL-заданию. ## Результаты Мы провели эксперименты в окружениях SMAC (StarCraft Multi-Agent Challenge) и GRF (Goal-Reaching Football), которые широко используются для оценки методов MARL. Выполнена сравнительная оценка CoDiCon с трёх современными методами. Результаты показали, что CoDiCon демонстрирует значительное превосходство в степени диверсификации политик и эффективности выполнения задачи. Особенно выделяется эффект интринсических конкурентных мотивов, которые стимулируют агентов к обнаружению более адаптивных и разнообразных стратегий. Это свидетельствует о том, что CoDiCon успешно решает проблему недостаточной стратегической диверсификации в MARL. ## Значимость Метод CoDiCon может быть применён в различных областях, таких как игровые системы, распределённые системы управления, искусственный интеллект в робототехнике и моделирования коллективного поведения. Основное преимущество CoDiCon заключается в том, что он не только увеличивает с

Annotation:

In recent years, diversity has emerged as a useful mechanism to enhance the efficiency of multi-agent reinforcement learning (MARL). However, existing methods predominantly focus on designing policies based on individual agent characteristics, often neglecting the interplay and mutual influence among agents during policy formation. To address this gap, we propose Competitive Diversity through Constructive Conflict (CoDiCon), a novel approach that incorporates competitive incentives into cooperat...

ID: 2509.14276v1 cs.MA, cs.AI

arXiv PDF

📄 Vulnerable Agent Identification in Large-Scale Multi-Agent Reinforcement Learning

2025-09-20

Авторы:

Simin Li, Zheng Yuwei, Zihao Mao, Linhao Wang, Ruixiao Xu, Chengdong Ma, Xin Yu, Yuqing Ma, Qi Dou, Xin Wang, Jie Luo, Bo An, Yaodong Yang, Weifeng Lv, Xianglong Liu

## Контекст В мире современных систем, основанных на многоагентной решающей системе (MAS), эффективность и надежность часто определяются внешними угрозами, такими как атаки, непредвиденные сбои или ограниченные ресурсы. Особенно волнующим становится вопрос идентификации самых уязвимых агентов в таких системах. Нарушение работы этих агентов может оказать значительное воздействие на общую производительность и надежность системы. В настоящем исследовании акцент ставится на тезис, что участие в многоагентной системе некоторых агентов может привести к критическим ошибкам и ухудшению работы всей системы. Данный аспект является ключевым для широкого круга приложений, в том числе для систем управления военными силами, сетей Интернета вещей (IoT) и цифровых средств управления технологическими процессами. Таким образом, необходимо разработать методы, способные эффективно определить и учесть эти важности для улучшения надежности и безопасности систем. ## Метод Для решения проблемы идентификации уязвимых агентов в многоагентной системе была предложена методология, основывающаяся на методах математической оптимизации и машинного обучения. Главной идеей является использование декомпозиции задачи на две подзадачи: выбор уязвимых агентов и построение наихудших случаев поведения для них. На первом этапе используется трансформация Фенхеля-Рокафелла (Fenchel-Rockafellar) для декомпозиции задачи на уровень выбора агентов и уровень построения атак. Эта трансформация позволяет упростить вычислительно трудные задачи, достигнув обособленного обучения на каждом уровне. Далее, решение выбора уязвимых агентов использует метод последовательного гребания (greedy) в сочетании с агентными сетями (RL). Затем, построение наихудших случаев поведения для выбранных уязвимых агентов осуществляется с использованием методов марковских решающих процессов (MDP), в результате чего получается наиболее эффективный вариант атаки. Этот двухуровневый подход позволяет эффективно столкнуться с проблемой идентификации уязвимых агентов в многоагентных системах. ## Результаты Исследование было проведено с использованием высокомасштабных многоагентных систем, включающих сотни агентов. Было проанализировано поведение системы при участии различных уровней атак, а также при определении наиболее уязвимых агентов. Результаты испытаний показали, что предложенная методика эффективно определяет уязвимых агентов и успешно руководствуется созданием максимального вреда для системы. Дополнительно, была проанализирована степень возде

Annotation:

ID: 2509.15103v1 cs.MA, cs.AI

arXiv PDF

📄 PromptSculptor: Multi-Agent Based Text-to-Image Prompt Optimization

2025-09-18

Авторы:

Dawei Xiang, Wenyan Xu, Kexin Chu, Zixu Shen, Tianqi Ding, Wei Zhang

## Контекст В последние годы сфера генерируемых с помощью искусственного интеллекта изображений развивается с быстрым темпом, в силу этого возникает необходимость в инструментах, упрощающих процесс создания качественных изображений. Одним из главных затруднений является то, что пользователи должны создавать подробные и точные текстовые запросы (промпты), чтобы добиться желаемого результата. Несмотря на прогресс в области генерируемых моделей текста-к-изображению, пользователи часто сталкиваются с трудностями в создании эффективных промптов, что требует многократных итераций и трудоемкого редактирования. Это проблема в особенности актуальна для тех, кто не имеет опыта в создании промптов. Мы предлагаем PromptSculptor, систему, которая автоматизирует процесс оптимизации промптов, сделав его более эффективным и доступным. ## Метод PromptSculptor основывается на фреймворке многоагентной системы, в которой четыре специализированных агента работают совместно, чтобы генерировать и оптимизировать промпты. Образец пользовательского ввода распадается на четыре ключевых участка: сценарий, стиль, контекст и детали. Каждый агент специализируется на одном из этих аспектов и создает подробные промпты, используя технологию Chain-of-Thought для дополнительной инференции контекста. На данном этапе используется самостоятельное суждение, чтобы проверять, соответствует ли новый промпт пользовательскому запросу. Также есть фидбек-агент, который использует пользовательский отзыв для дальнейшего тонкого тюнинга. Архитектура была разработана таким образом, чтобы модель была модельно-агностичной и могла быть легко интегрирована с различными моделями генерируемых текста-к-изображению. ## Результаты Мы провели эксперименты сравнивая PromptSculptor с другими существующими подходами к оптимизации промптов. Наши результаты показывают, что наша система сокращает число итераций, необходимых для достижения стабильного удовлетворения пользователя, что приводит к улучшению качества изображений. Мы протестировали нашу модель с разными моделями генерируемых текста-к-изображению и обнаружили, что PromptSculptor позволяет получить значительно более точные и стилизованные изображения, даже при неполных и неточных пользовательских промптах. Это демонстрирует высокую эффективность нашей системы в создании качественных промптов с минимальными пользовательскими усилиями. ## Значимость ПромптСкульптор может быть применен в различных областях, где требуется качественное графическое оформление, например в дизайне, визуализации и рекламе. Одной из основных преимущ

Annotation:

The rapid advancement of generative AI has democratized access to powerful tools such as Text-to-Image models. However, to generate high-quality images, users must still craft detailed prompts specifying scene, style, and context-often through multiple rounds of refinement. We propose PromptSculptor, a novel multi-agent framework that automates this iterative prompt optimization process. Our system decomposes the task into four specialized agents that work collaboratively to transform a short, v...

ID: 2509.12446v1 cs.MA, cs.AI

arXiv PDF

📄 MALLM: Multi-Agent Large Language Models Framework

2025-09-17

Авторы:

Jonas Becker, Lars Benedikt Kaesberg, Niklas Bauer, Jan Philip Wahle, Terry Ruas, Bela Gipp

#### Контекст Многоагентные дебаты (MAD) являются мощным инструментом для повышения коллективного интеллекта, основанного на масштабировании вычислительного ресурса во время выполнения тестов и использовании экспертного знания. Однако существующие системы MAD часто ограничены в гибкости интегрированной оценки, конфигурировании личностей агентов, генераторов ответов, парадигм дебатов и протоколов принятия решений. Таким образом, необходимо создать более гибкую и настраиваемую платформу для исследований в области многоагентных дебатов. #### Метод MALLM (Multi-Agent Large Language Models) — это открытая платформа, разработанная для систематического анализа компонентов многоагентных дебатов. Она предоставляет более 144 уникальных конфигураций дебатов, включая (1) личности агентов (например, эксперт, личности), (2) генераторы ответов (например, критический, разумный), (3) парадигмы дебатов (например, память, передача) и (4) протоколы принятия решений (например, голосование, консенсус). MALLM позволяет определять дебаты с помощью простых файлов конфигураций. Кроме того, она поддерживает загрузку текстовых датасетов (например, MMLU-Pro, WinoGrande) и предоставляет полный пайплайн для оценки и сравнения конфигураций MAD. #### Результаты Проведенные эксперименты позволили протестировать различные конфигурации MAD. MALLM эффективно сталкивает агентов в конфликтных ситуациях, используя различные личности, генераторы ответов и протоколы принятия решений. Оценка результатов показала, что MALLM обеспечивает гибкость и надежность в анализе многоагентных дебатов, что демонстрирует мощь предложенного фреймворка. #### Значимость MALLM может быть применен в области моделирования разума, взаимодействия агентов и решения проблем с использованием многоагентных дебатов. Он предоставляет широкий спектр конфигураций, что позволяет лучше понять взаимодействие различных компонентов MAD. Помимо этого, MALLM может использоваться для проведения конкретных исследований и сравнения новых идей в области многоагентных дебатов. #### Выводы MALLM представляет собой инновационный подход к исследованию многоагентных дебатов. Он открывает новые возможности для изучения интеллектуальных процессов в многоагентных системах. Будущие исследования будут нацелены на расширение функциональности MALLM, улучшение его методов оценки и расширение применений в различных областях.

Annotation:

Multi-agent debate (MAD) has demonstrated the ability to augment collective intelligence by scaling test-time compute and leveraging expertise. Current frameworks for multi-agent debate are often designed towards tool use, lack integrated evaluation, or provide limited configurability of agent personas, response generators, discussion paradigms, and decision protocols. We introduce MALLM (Multi-Agent Large Language Models), an open-source framework that enables systematic analysis of MAD compone...

ID: 2509.11656v1 cs.MA, cs.AI, cs.CL, A.1; I.2.7

arXiv PDF

Показано 81 - 90 из 117 записей