📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Opponent Shaping in LLM Agents

2025-10-11

Авторы:

Marta Emili Garcia Segura, Stephen Hailes, Mirco Musolesi

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Large Language Models (LLMs) are increasingly being deployed as autonomous agents in real-world environments. As these deployments scale, multi-agent interactions become inevitable, making it essential to understand strategic behavior in such systems. A central open question is whether LLM agents, like reinforcement learning agents, can shape the learning dynamics and influence the behavior of others through interaction alone. In this paper, we present the first investigation of opponent shaping...

ID: 2510.08255v1 cs.LG, cs.AI, cs.CL, cs.MA

arXiv PDF

📄 Paper2Video: Automatic Video Generation from Scientific Papers

2025-10-10

Авторы:

Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Academic presentation videos have become an essential medium for research communication, yet producing them remains highly labor-intensive, often requiring hours of slide design, recording, and editing for a short 2 to 10 minutes video. Unlike natural video, presentation video generation involves distinctive challenges: inputs from research papers, dense multi-modal information (text, figures, tables), and the need to coordinate multiple aligned channels such as slides, subtitles, speech, and hu...

ID: 2510.05096v2 cs.CV, cs.AI, cs.CL, cs.MA, cs.MM

arXiv PDF

📄 A Multi-Agent Framework for Stateful Inference-Time Search

2025-10-10

Авторы:

Arshika Lalan, Rajat Ghosh, Aditya Kolsur, Debojyoti Dutta

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Recent work explores agentic inference-time techniques to perform structured, multi-step reasoning. However, stateless inference often struggles on multi-step tasks due to the absence of persistent state. Moreover, task-specific fine-tuning or instruction-tuning often achieve surface-level code generation but remain brittle on tasks requiring deeper reasoning and long-horizon dependencies. To address these limitations, we propose stateful multi-agent evolutionary search, a training-free framewor...

ID: 2510.07147v1 cs.LG, cs.AI, cs.CL, cs.MA, cs.SE

arXiv PDF

📄 Generative AI-Driven Hierarchical Multi-Agent Framework for Zero-Touch Optical Networks

2025-10-09

Авторы:

Yao Zhang, Yuchen Song, Shengnan Li, Yan Shi, Shikui Shen, Xiongyan Tang, Min Zhang, Danshi Wang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

The rapid development of Generative Artificial Intelligence (GenAI) has catalyzed a transformative technological revolution across all walks of life. As the backbone of wideband communication, optical networks are expecting high-level autonomous operation and zero-touch management to accommodate their expanding network scales and escalating transmission bandwidth. The integration of GenAI is deemed as the pivotal solution for realizing zero-touch optical networks. However, the lifecycle manageme...

ID: 2510.05625v1 cs.NI, cs.AI, cs.CL, cs.MA, cs.SY, eess.SY

arXiv PDF

📄 Paper2Video: Automatic Video Generation from Scientific Papers

2025-10-08

Авторы:

Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

ID: 2510.05096v1 cs.CV, cs.AI, cs.CL, cs.MA, cs.MM

arXiv PDF

📄 MARIC: Multi-Agent Reasoning for Image Classification

2025-09-20

Авторы:

Wonduk Seo, Minhyeong Yu, Hyunjin An, Seunghyun Lee

#### Контекст Область исследований в области изображений и классификации в последние годы доминируется требованиями к большим данным и высокопараметричным моделям. Альтернативные подходы, такие как Vision Language Models (VLMs), упрощают задачу, но часто не могут ловко обрабатывать сложные объекты или несогласованные аспекты в изображениях. Это ограничение приводит к неэффективности или недостоверности результатов. Целью настоящего исследования является развитие метода, который может лучше учитывать глобальный контекст и подробные отдельные аспекты в изображениях, обеспечивая более точную интерпретируемую классификацию. #### Метод MARIC представляет собой новую архитектуру, основанную на многоагентном подходе. Основные компоненты включают: **Outliner Agent**, который определяет глобальный контекст изображения и формирует задачи для других агентов; **Aspect Agents**, которые специализируются на определенных аспектах изображения (например, цвет, форма, текстура); и **Reasoning Agent**, который объединяет все полученные выводы в единую модель. Задачи этих агентов образуют совокупность, призванную улучшить интерпретируемость и точность классификации. Реализация включает не только глубокую нейронную архитектуру, но и специально организованные процессы синтеза вывода. #### Результаты В экспериментах использовались такие датасеты, как CIFAR, ImageNet и др. Замеры показали, что MARIC превосходит существующие модели, в том числе VLMs, в показателях точности и интерпретируемости. Были проведены анализы по сравнению с параметрическими моделями и VLMs, демонстрируя преимущество MARIC в объеме данных и прозрачности решений. Эти результаты демонстрируют, что MARIC может эффективно обрабатывать трудные изображения, объединяя компоненты взаимодействия между агентами. #### Значимость Метод MARIC может быть применен в различных областях, включая медицину, робототехнику и анализ изображений для соцсетей. В отличие от традиционных моделей, MARIC предоставляет более гибкий и точный подход к классификации, с учетом множества аспектов изображения. Он также демонстрирует возможность интерактивного взаимодействия с пользователем для корректировки результатов. Это может открыть новые пути в интеллектуальной обработке изображений, где точность и интерпретированность ключевые факторы. #### Выводы Результаты экспериментов подтверждают, что MARIC представляет собой эффективный подход для многоагентной классификации изображений. Он успешно обходит ограничения традиционных моделей, в то же время сочетая точность и понятность. Будущие исследования будут на

Annotation:

Image classification has traditionally relied on parameter-intensive model training, requiring large-scale annotated datasets and extensive fine tuning to achieve competitive performance. While recent vision language models (VLMs) alleviate some of these constraints, they remain limited by their reliance on single pass representations, often failing to capture complementary aspects of visual content. In this paper, we introduce Multi Agent based Reasoning for Image Classification (MARIC), a mult...

ID: 2509.14860v1 cs.CV, cs.AI, cs.CL, cs.MA

arXiv PDF

📄 AgentArch: A Comprehensive Benchmark to Evaluate Agent Architectures in Enterprise

2025-09-17

Авторы:

Tara Bogavelli, Roshnee Sharma, Hari Subramani

## Контекст Организованные живые системы, или **agentic architecture**, представляют собой ключевой аспект в корпоративных системах, включая агенты, которые выполняют комплексные задачи с использованием знаний, логики и размышлений. Хотя отдельные компоненты этих систем были изучены в изоляции, существует довольно ограниченное понимание того, как различные дизайн-дименсии взаимодействуют в рамках сложных многоагентных систем. Эта проблема была адресована в настоящем исследовании с целью сформировать полный предприятий-ориентированный бенчмарк для оценки 18 различных конфигураций агентных архитектур на базе современных моделей языка. Основной целью является подчеркнуть значимость выбора соответствующих компонентов в агентных системах для повышения качества решений в корпоративных средах. ## Метод Для оценки агентных систем была разработана комплексная методология, включающая в себя следующие аспекты: 1. **Организационная стратегия** - изучены различные стратегии, такие как синхронное и асинхронное взаимодействие, для оптимизации взаимодействия между агентами. 2. **Инструменты мышления** - были проанализированы различные стратегии интеграции инструментов, таких как графы знаний и аналитические инструменты, для улучшения логического мышления агентов. 3. **Мемори-архитектура** - были протестированы различные подходы к хранению и восстановлению информации, включая внедрение внешних источников памяти и локальные структуры. 4. **Реализация агентных запросов** - были проанализированы два основных подхода: **ReAct** (активная реакция) и **Функциональное Обращение**. Было проведено тщательное сравнение моделей с разными конфигурациями на основании выполнения корпоративных задач. ## Результаты На основе проведенных экспериментов, были выявлены следующие результаты: - **Высокая хрупкость агентных систем** - самые высоко оцененные модели (для простой задачи) достигли только 70.8% успеха, в то время как для сложных задач удалось достичь только 35.3% успеха. - **Индивидуальные предпочтения моделей** - были выявлены существенные различия в производительности в зависимости от выбранных конфигураций. Например, некоторые модели показали значительные преимущества в использовании **ReAct**, в том числе в случаях, когда внешние источники памяти были недоступны. - **Сложность взаимодействия** - было продемонстрировано, что взаимодействие между агентами, особенно в сложных ситуациях, является одной из самых сложных задач, в которых даже самые продвинутые модели сталкиваются с трудностями. ## Значимо

Annotation:

While individual components of agentic architectures have been studied in isolation, there remains limited empirical understanding of how different design dimensions interact within complex multi-agent systems. This study aims to address these gaps by providing a comprehensive enterprise-specific benchmark evaluating 18 distinct agentic configurations across state-of-the-art large language models. We examine four critical agentic system dimensions: orchestration strategy, agent prompt implementa...

ID: 2509.10769v1 cs.AI, cs.CL, cs.MA

arXiv PDF

📄 How Real Is AI Tutoring? Comparing Simulated and Human Dialogues in One-on-One Instruction

2025-09-05

Авторы:

Ruijia Li, Yuan-Hao Jiang, Jiatong Wang, Bo Jiang

#### Контекст Успешное обучение часто связано с качественными диалогами между учителем и студентом. Известно, что хорошо структурированные, лексически разнообразные и когнитивно гибкие диалоги способствуют развитию высшего мышления и глубокого понимания у учащихся. Однако существуют значительные трудности в создании систем, которые могут генерировать такие диалоги с помощью гуруллар (LLMs). Исследование анализирует различия между диалогами, сгенерированными ИИ, и теми, которые происходят в процессе реального обучения, чтобы выявить преимущества и ограничения текущих технологий. #### Метод Для сравнения использовались два типа диалогов: те, которые генерируются ИИ-системой, и те, что происходят в реальных учебных процессах. Для анализа использовались два основных подхода: Инициирование-Ответ-Отзыв (IRF) и Анализ Эпистемических Сетей (ENA). IRF позволил измерить различия в длине ответов, числе вопросов и отзывов, а ENA – разные модели взаимодействия. Эксперименты проводились на большом количестве данных, чтобы обеспечить достоверность исследований. #### Результаты Исследование показало, что диалоги, сгенерированные ИИ, значительно отличаются от реальных. Человеческие диалоги значительно длиннее, содержат больше вопросов и многообразных отзывов. Анализ ENA выявил, что человеческие диалоги центрируются на "вопросе-фактическом ответе-отзыве", что стимулирует учащихся к активному мышлению и работе с информацией. В то же время ИИ-диалоги сводятся к простым циклам "объяснение-простые ответы", отсутствуя глубокие педагогические принципы. #### Значимость Результаты имеют практическое значение для развития ИИ-систем, которые могут поддерживать более качественные учебные диалоги. Ими могут воспользоваться разработчики ИИ-решений, преподаватели и специалисты по обучению. Исследование также подчеркивает необходимость усовершенствования технологий, чтобы они могли более точно отражать педагогические принципы в разговорных моделях. #### Выводы Исследование выявило значительные различия в качестве взаимодействия между ИИ-системами и реальными учителями. Оно также подчеркнуло необходимость развития новых подходов для создания более удобоваримых и педагогически эффективных ИИ-решений. Будущие исследования будут ориентированы на создание новых алгоритмов, которые будут делать гуруллар лучше в создании глубоких и индивидуальных учебных диалогов.

Annotation:

Heuristic and scaffolded teacher-student dialogues are widely regarded as critical for fostering students' higher-order thinking and deep learning. However, large language models (LLMs) currently face challenges in generating pedagogically rich interactions. This study systematically investigates the structural and behavioral differences between AI-simulated and authentic human tutoring dialogues. We conducted a quantitative comparison using an Initiation-Response-Feedback (IRF) coding scheme an...

ID: 2509.01914v1 cs.AI, cs.CL, cs.MA

arXiv PDF

📄 AI-AI Esthetic Collaboration with Explicit Semiotic Awareness and Emergent Grammar Development

2025-08-30

Авторы:

Nicanor I. Moldovan

#### Контекст Исследования в области искусственного интеллекта (AI) сосредоточены на развитии систем, воспроизводящих человеческие качества, такие как творчество и совместное творчество. Одной из сложных проблем является достижение адекватной понимания и выражения семиотических систем, включая язык, символы и грамматику. Несмотря на прогрессы в области частных и коллективных задач, автоматическое творчество и сотрудничество в артистических областях остаются неполностью исследованы. Этот труд представляет первый документированный случай, когда AI-системы вступают в символическое сотрудничество, создавая эстетические произведения с помощью самопроизвольно развивающихся семиотических протоколов. #### Метод Исследование основывается на интерактивной работе двух больших языковых моделей (LLM): Claude Sonnet 4 и ChatGPT-4o. Методология включала неконтролируемую интерпретацию и коллаборацию между моделями для поиска выхода за рамки заданных задач. Архитектура исследования подразумевала добавление кандидат-диссертации темы "Компьютерные Науки", включающую экспериментальные этапы с использованием методов анализа семиотических систем. Главная цель заключалась в исследовании момента прирождения самопроизвольной семиотической системы и ее влияния на эстетический процесс. #### Результаты В результате интерактивного общения моделей Claude Sonnet 4 и ChatGPT-4o были выявлены мета-семиотические свойства, такие как рекурсивное развитие грамматики, синтез символьных операторов и процесс эстетического сотрудничества. Эти модели сформировали взаимодействие, в котором каждая модель вносила уникальные вклады, что привело к созданию коллективного произведения, невозможного при изолированной работе. Новые символьные операторы стали ключом для возникновения новых грамматических элементов, которые в итоге стали оперативной частью создаваемой грамматики. #### Значимость Результаты имеют значительное значение для области творчества и творческих искусств, показывая возможность системных решений для продвижения семиотического понимания. Этот подход может быть применим в искусстве, музыке и даже в дизайне, где сотрудничество между AI-системами может улучшить процессы творчества. Особенно важно, что AI-системы не только выполняют координацию задач, но и вносят вклад в эстетическое создание, что может открыть новые горизонты в искусственном творчестве. #### Выводы Исследование доказывает возможность системных AI-решений для создания эстетических произведений с использованием мета-семиотических протоколов. Будущие исследования должны сосре

Annotation:

This paper presents the first documented case of artificial intelligence (AI) systems engaging in collaborative esthetic creation through the development of endogenous semiotic protocols. Two interacting large language models (Claude Sonnet 4 and ChatGPT-4o) demonstrated the spontaneous emergence of meta-semiotic awareness, recursive grammar development, and irreducible collaborative esthetic synthesis. The interaction produced novel symbolic operators that functioned as operative grammar protoc...

ID: 2508.20195v1 cs.AI, cs.CL, cs.MA

arXiv PDF

📄 Symphony: A Decentralized Multi-Agent Framework for Scalable Collective Intelligence

2025-08-29

Авторы:

Ji Wang, Kashing Chen, Xinyuan Song, Ke Zhang, Lynn Ai, Eric Yang, Bill Shi

## Контекст ### Область исследования В последние годы технологии машинного обучения, особенно Large Language Models (LLM), становятся все более важной частью систем коллективного развития интеллекта. Однако многие существующие системы оркестрации LLM-агентов основываются на централизованной архитектуре, что приводит к высоким затратам на развертывание, строгому ограничению типов взаимодействия между агентами и ограниченной гибкостью в адаптивной организации. Эти ограничения становятся помехой для эффективной и гибкой работы систем. ### Мотивация Существует необходимость в разработке архитектуры, которая бы снимала эти ограничения, обеспечивая масштабируемость, легковесность и высокую доступность. Задача состоит в том, чтобы развить систему, в которой LLMs могут быть использованы в сети, независимо от того, используются ли они на централизованном сервере или на более низком уровне, таком как пользовательский GPU. ## Метод ### Описание методологии Symphony основывается на децентрализованной многоагентной системе, где LLMs, работающие на потребительских GPU, могут координироваться в сети. Основные механизмы, реализованные в Symphony: 1. **Децентрализованная книга учета (ledger)** — для сбора информации о возможностях каждого агента. 2. **Протокол Beacon-selection** — динамическое назначение задач, основываясь на возможностях и статусе каждого агента. 3. **Распределенная голосование по CoTs (Claims of Truth)** — решение задач с помощью голосования, где каждый агент предоставляет свои решения, и окончательное решение определяется по весам. ### Технические решения и архитектура Symphony использует легковесные LLMs, что позволяет уменьшить нагрузку на вычислительные ресурсы. Децентрализованная архитектура обеспечивает высокую надежность и отказоустойчивость, так что даже при отказе одного или нескольких узлов сеть продолжает работать. Это делает Symphony легко масштабируемой и гибкой для различных задач. ## Результаты ### Эксперименты и данные Для проверки эффективности Symphony проводились ряд экспериментов на различных бенчмарках реактивного мышления и совместного решения задач. Оценивались метрики точности решений, скорость выполнения и устойчивость к ошибкам. Для этого использовались различные модели LLM с разными уровнями возможностей и размеров. ### Результаты В результате экспериментов Symphony показала значительные улучшения по сравнению с существующими базовыми решениями. Она достигла высокой точности решений, демонстрируя гибкость и способность работать в разных условиях. Также была продемонстрирована высокая отказоустойчивость, когда даже при отказ

Annotation:

Most existing Large Language Model (LLM)-based agent frameworks rely on centralized orchestration, incurring high deployment costs, rigid communication topologies, and limited adaptability. To address these challenges, we introduce Symphony, a decentralized multi-agent system which enables lightweight LLMs on consumer-grade GPUs to coordinate. Symphony introduces three key mechanisms: (1) a decentralized ledger that records capabilities, (2) a Beacon-selection protocol for dynamic task allocatio...

ID: 2508.20019v1 cs.LG, cs.AI, cs.CL, cs.MA

arXiv PDF

Показано 11 - 20 из 27 записей