📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 A Modular Cognitive Architecture for Assisted Reasoning: The Nemosine Framework

2025-12-06

Авторы:

Edervaldo Melo

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This paper presents the Nemosine Framework, a modular cognitive architecture designed to support assisted reasoning, structured thinking, and systematic analysis. The model operates through functional cognitive modules ("personas") that organize tasks such as planning, evaluation, cross-checking, and narrative synthesis. The framework combines principles from metacognition, distributed cognition, and modular cognitive systems to offer an operational structure for assisted problem-solving and dec...

ID: 2512.04500v1 cs.AI, cs.HC, cs.MA

arXiv PDF

📄 DialogGuard: Multi-Agent Psychosocial Safety Evaluation of Sensitive LLM Responses

2025-12-04

Авторы:

Han Luo, Guy Laban

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Large language models (LLMs) now mediate many web-based mental-health, crisis, and other emotionally sensitive services, yet their psychosocial safety in these settings remains poorly understood and weakly evaluated. We present DialogGuard, a multi-agent framework for assessing psychosocial risks in LLM-generated responses along five high-severity dimensions: privacy violations, discriminatory behaviour, mental manipulation, psychological harm, and insulting behaviour. DialogGuard can be applied...

ID: 2512.02282v1 cs.AI, cs.HC, cs.MA

arXiv PDF

📄 Intent-Driven LLM Ensemble Planning for Flexible Multi-Robot Disassembly: Demonstration on EV Batteries

2025-10-22

Авторы:

Cansu Erdogan, Cesar Alan Contreras, Alireza Rastegarpanah, Manolis Chiou, Rustam Stolkin

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This paper addresses the problem of planning complex manipulation tasks, in which multiple robots with different end-effectors and capabilities, informed by computer vision, must plan and execute concatenated sequences of actions on a variety of objects that can appear in arbitrary positions and configurations in unstructured scenes. We propose an intent-driven planning pipeline which can robustly construct such action sequences with varying degrees of supervisory input from a human using simple...

ID: 2510.17576v1 cs.RO, cs.AI, cs.HC, cs.MA

arXiv PDF

📄 FURINA: A Fully Customizable Role-Playing Benchmark via Scalable Multi-Agent Collaboration Pipeline

2025-10-10

Авторы:

Haotian Wu, Shufan Jiang, Chios Chen, Yiyang Feng, Hehai Lin, Heqing Zou, Yao Shu, Yanran Li, Chengwei Qin

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

As large language models (LLMs) advance in role-playing (RP) tasks, existing benchmarks quickly become obsolete due to their narrow scope, outdated interaction paradigms, and limited adaptability across diverse application scenarios. To address this gap, we introduce FURINA-Builder, a novel multi-agent collaboration pipeline that automatically constructs fully customizable RP benchmarks at any scale. It enables evaluation of arbitrary characters across diverse scenarios and prompt formats, as th...

ID: 2510.06800v1 cs.CL, cs.AI, cs.HC, cs.MA

arXiv PDF

📄 ID-RAG: Identity Retrieval-Augmented Generation for Long-Horizon Persona Coherence in Generative Agents

2025-10-02

Авторы:

Daniel Platnick, Mohamed E. Bengueddache, Marjan Alirezaie, Dava J. Newman, Alex ''Sandy'' Pentland, Hossein Rahnama

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Generative agents powered by language models are increasingly deployed for long-horizon tasks. However, as long-term memory context grows over time, they struggle to maintain coherence. This deficiency leads to critical failures, including identity drift, ignoring established beliefs, and the propagation of hallucinations in multi-agent systems. To mitigate these challenges, this paper introduces Identity Retrieval-Augmented Generation (ID-RAG), a novel mechanism designed to ground an agent's pe...

ID: 2509.25299v1 cs.AI, cs.HC, cs.MA

arXiv PDF

📄 A(I)nimism: Re-enchanting the World Through AI-Mediated Object Interaction

2025-10-02

Авторы:

Diana Mykhaylychenko, Maisha Thasin, Dunya Baradari, Charmelle Mhungu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Animist worldviews treat beings, plants, landscapes, and even tools as persons endowed with spirit, an orientation that has long shaped human-nonhuman relations through ritual and moral practice. While modern industrial societies have often imagined technology as mute and mechanical, recent advances in artificial intelligence (AI), especially large language models (LLMs), invite people to anthropomorphize and attribute inner life to devices. This paper introduces A(I)nimism, an interactive insta...

ID: 2509.25558v1 cs.AI, cs.HC, cs.MA, cs.MM

arXiv PDF

📄 Fairy: Interactive Mobile Assistant to Real-world Tasks via LMM-based Multi-agent

2025-09-26

Авторы:

Jiazheng Sun, Te Yang, Jiayang Niu, Mingxuan Li, Yongyong Lu, Ruimeng Yang, Xin Peng

#### Контекст Современные мобильные приложения часто имеют разнообразные интерфейсы и требуют интерактивного взаимодействия с пользователем. Однако существующие системы-помощники часто столкнуваются с трудностями в обработке реальных сценариев, в которых данные интерфейсов мобильных приложений имеют разнообразие и постоянно меняются. Это ограничивает их эффективность в решении реальных задач. Кроме того, традиционные методы, опирающиеся на коммуникативные модели, часто не удается обеспечить точное выполнение задач, особенно в случае наличия длинных хвостовых распределений. Таким образом, нужно развить более интерактивные и самообучающиеся системы, которые могут более точно выполнять пользовательские задачи в реальном мире. #### Метод Fairy — это интерактивная мобильная система, состоящая из трех основных модулей: (i) **Global Task Planner**, который переводит пользовательские задачи на уровень суб-задач, работая в кросс-приложении; (ii) **App-Level Executor**, который уточняет подзадачи в детальные действия и синхронизирует их с пользователем в реальном времени, используя два уровня памяти (длинносрочная и краткосрочная) и четыре агента; и (iii) **Self-Learner**, который формирует **App Map** и **Tricks**, улучшая свою производительность в процессе использования. Fairy также включает в себя систему для коллективной работы между приложениями, обеспечивающую взаимодействие и самостоятельное обучение. #### Результаты Для оценки эффективности Fairy была разработана **RealMobile-Eval**, реальный комплексный бенчмарк, который позволяет получить скоры пользователя в реальных сценариях. Наши эксперименты показали, что Fairy, использующая GPT-4o как базу, значительно превосходит состояние технологии по нескольким критериям: (i) улучшение завершения пользовательских задач на 33.7%, (ii) снижение необходимых действий на 58.5%, (iii) высокую точность выполнения и (iv) улучшение кросс-приложенческой синергии. Эти результаты демонстрируют значимую эффективность Fairy в решении реальных задач в среде мобильных приложений. #### Значимость Fairy может применяться в различных сферах, таких как мобильные приложения, технологии управления и самообучающиеся системы. Ее основные преимущества заключаются в (i) точном выполнении задач, (ii) улучшении работы в кросс-приложениях, (iii) самообучающейся природе, которая позволяет улучшать свои возможности в процессе использования. Это может иметь большой потенциальный влияние на развитие интерактивных систем, улучшение пользовательского опыта в различных приложениях и увеличение эффективности в решении задач в реальном мире. #### Выводы

Annotation:

Large multi-modal models (LMMs) have advanced mobile GUI agents. However, existing methods struggle with real-world scenarios involving diverse app interfaces and evolving user needs. End-to-end methods relying on model's commonsense often fail on long-tail apps, and agents without user interaction act unilaterally, harming user experience. To address these limitations, we propose Fairy, an interactive multi-agent mobile assistant capable of continuously accumulating app knowledge and self-evolv...

ID: 2509.20729v1 cs.AI, cs.HC, cs.MA

arXiv PDF

📄 Agentic AI for Financial Crime Compliance

2025-09-18

Авторы:

Henrik Axelsen, Valdemar Licht, Jan Damsgaard

## Контекст Отрасль финансовых услуг сталкивается с ростом затрат и сложности в соблюдении финансовых правил (FCC), при этом не всегда достигается улучшение эффективности. Искусственный интеллект (AI) предлагает потенциал для решения этих проблем, но многие существующие решения остаются непрозрачными и не вполне соответствуют регуляторным требованиям. Недостаточная транспарентность и слабая адаптация к регуляторным ожиданиям мешают рациональному применению AI в области FCC. Данная работа фокусируется на разработке и развертывании agentic AI-системы для FCC в цифровых финансовых платформах, которая автоматизирует процессы регистрации, мониторинга, расследования и составления отчетов. ## Метод Разработка системы основывается на Action Design Research (ADR), взаимодействии с fintech-компанией и регуляторными органами. Методология включает использование artifact-centric modeling, который разграничивает роли автономных агентов и обеспечивает задаческое направление моделей, а также ведение журналов аудита. Это подход организует транспарентную и трассируемую структуру решений, позволяя гарантировать соответствие FCC-требованиям. Этакие шаги позволяют разрабатывать систему, которая не только автоматизирует процессы, но и обеспечивает уверенность в соблюдении законодательства в условиях высоких регуляторных стандартов. ## Результаты В результате исследования была разработана и развернута реальная система, которая продемонстрировала способность автоматизировать составляющие FCC-процессы, включая регистрацию клиентов, мониторинг активности, расследование подозрительных транзакций и составление отчетов. Данные для экспериментов были получены в реальных условиях работы с fintech-платформой. Результаты показали улучшение прозрачности и трассируемости процессов, что положительно сказалось на уровне доверия к решениям системы. Этот подход также позволил уменьшить время на выполнение задач и уменьшить риски ошибок. ## Значимость Полученная система может применяться во многих областях, где необходимо соблюдение строгих регуляторных требований, включая банковское дело, страхование и другие финансовые услуги. Основные преимущества заключаются в увеличении прозрачности, доверия и эффективности, что позволяет сократить затраты на соблюдение FCC и повысить уровень соблюдения закона. Данная работа может способствовать развитию литературы в области AI-enabled compliance, демонстрируя, как автоматизация может реконфигурировать FCC-процессы, при этом сохраняя ответственность и уверенность в решениях. ## Выводы Разработанная система показала, что agentic AI может значительно повлиять на область FCC, улучшая проц

Annotation:

The cost and complexity of financial crime compliance (FCC) continue to rise, often without measurable improvements in effectiveness. While AI offers potential, most solutions remain opaque and poorly aligned with regulatory expectations. This paper presents the design and deployment of an agentic AI system for FCC in digitally native financial platforms. Developed through an Action Design Research (ADR) process with a fintech firm and regulatory stakeholders, the system automates onboarding, mo...

ID: 2509.13137v1 cs.AI, cs.HC, cs.MA, K.4.4; K.6.5; I.2.11

arXiv PDF

📄 Agentic Lybic: Multi-Agent Execution System with Tiered Reasoning and Orchestration

2025-09-17

Авторы:

Liangxuan Guo, Bin Zhu, Qingqian Tao, Kangning Liu, Xun Zhao, Xianzhe Qin, Jin Gao, Guangfu Hao

## Контекст В современных вычислительных средах возрастает спрос на системы, которые могут автоматизировать сложные многошаговые задачи. Однако, агентные системы, предназначенные для десктопной автоматизации, часто сталкиваются с проблемами, связанными с неэффективной координацией и недостаточным контролем качества. Эти проблемы приводят к нестабильности в работе и ограниченной гибкости при адаптации к различным сценариям. Таким образом, требуется разработка новых подходов, которые обеспечат более надёжный и универсальный подход к автоматизации десктопных задач. ## Метод Agentic Lybic представляет собой уникальную систему, основанную на многоагентном подходе с использованием конечного автомата (FSM). Архитектура системы включает четыре основных компонента: **Controller** (координатор), **Manager** (менеджер), **Workers** (исполнители) и **Evaluator** (оценщик). Каждый из них отвечает за заданный аспект выполнения задачи. Работа системы основывается на динамической роутинге задач между этими компонентами через FSM-обработчик. Это позволяет выполнять адаптивную перепланировку и восстановление из ошибок. Принципиально новым является интеграция в систему непрерывного контроля качества, который позволяет обеспечить стабильность работы и адаптивность к нестандартным ситуациям. ## Результаты На основе широко известного бенчмарка OSWorld были проведены испытания системы Agentic Lybic. Эксперименты показали, что система достигает современников в среднем успешности задач, выполняя их за 50 шагов с успешностью 57.07%. Это значительно выше результатов других систем, которые, как правило, останавливаются на значительно нижем уровне. Особое внимание уделялось измерению качества решений и их устойчивости к ошибкам. Такие результаты доказывают, что использование FSM и непрерывного контроля качества позволяет системе Agentic Lybic значительно улучшить стабильность и универсальность решений в сложных вычислительных средах. ## Значимость Предлагаемая система Agentic Lybic может использоваться в различных областях, где требуется надежная автоматизация десктопных задач. Особую значимость она приобретает в сферах, где необходимо высокий уровень надежности и адаптивности. Отличительным преимуществом является улучшенная универсальность и стабильность, что определяет потенциальное влияние на развитие технологий автоматизации. Это приложение может существенно упростить работу с комплексными задачами в многошаговых сценариях. ## Выводы Agentic Lybic достигает современного лидерства в производительности за счёт принципиально нового подхода к многоагентной системе с FSM-оркестраци

Annotation:

Autonomous agents for desktop automation struggle with complex multi-step tasks due to poor coordination and inadequate quality control. We introduce Agentic Lybic, a novel multi-agent system where the entire architecture operates as a finite-state machine (FSM). This core innovation enables dynamic orchestration. Our system comprises four components: a Controller, a Manager, three Workers (Technician for code-based operations, Operator for GUI interactions, and Analyst for decision support), an...

ID: 2509.11067v2 cs.AI, cs.HC, cs.MA

arXiv PDF

📄 The Anatomy of a Personal Health Agent

2025-08-30

Авторы:

A. Ali Heydari, Ken Gu, Vidya Srinivas, Hong Yu, Zhihan Zhang, Yuwei Zhang, Akshay Paruchuri, Qian He, Hamid Palangi, Nova Hammerquist, Ahmed A. Metwally, Brent Winslow, Yubin Kim, Kumar Ayush, Yuzhe Yang, Girish Narayanswamy, Maxwell A. Xu, Jake Garrison, Amy Aremnto Lee, Jenny Vafeiadou, Ben Graef, Isaac R. Galatzer-Levy, Erik Schenck, Andrew Barakat, Javier Perez, Jacqueline Shreibati, John Hernandez, Anthony Z. Faranesh, Javier L. Prieto, Connor Heneghan, Yun Liu, Jiening Zhan, Mark Malhotra, Shwetak Patel, Tim Althoff, Xin Liu, Daniel McDuff, Xuhai "Orson" Xu

## Контекст Повышение здоровья и благополучия является фундаментальным аспектом человеческого жизненного благополучия. С появлением продвинутых бо LLM (большие лингвистические модели), происходит развитие нового поколения здравоохранения. Однако применение нейронных сетей в рамках здоровья, ориентированных на функционирование в повседневных, неклинических ситуациях, пока не достаточно исследовано. Целью данного исследования является создание комплексного личного здравоохранения помощника, который может выполнять логические выводы на основе многомодальных данных из повседневных устройств сертификации здоровья и личных здравоохранений, предоставляя личноспособные рекомендации. Для уточнения потребностей пользователей в сотрудничестве с подобными помощниками, анализировались запросы в поисковиках и форумах, а также проведены исследования в рамках пользовательного дизайна. ## Метод В работе предложена многоагентная система, состоящая из трех основных компонентов: (1) агент-анality data science agent, (2) агент-ан expert agent, (3) агент-ан health coach agent. Каждый выполняет частный функционал: анализ трекаторных данных, интеграция здравоохранения и продвижение стратегий поддержки здоровья. Для реализации фреймворка разработаны многомодальные методы обработки данных, сочетающие выдачу данных, тренировку моделей и предоставление личных рекомендаций. Исследования проводились используя данные более 7,000 запросов и 1,100 часов экспертных оценок. ## Результаты Агент прошел 10 бенчмарк-задач, включающих обработку серийных данных, выводы о здоровье и прогнозирование поведения. В результате концептуальных испытаний с оценками экспертов, было доказано, что система удовлетворяет потребности пользователей и может давать конкретные рекомендации на основании индивидуальных данных. Исследования показали, что система PHA превышает существующие подходы по точности, персонализации и поддержке пользователей. ## Значимость Предложенная система может применяться в различных сферах, включая личное здравоохранение, телемедицинские приложения и программы оздоровления. Она предоставляет комплексные решения, повышает точность диагностики и поддерживает пользователей в достижении здоровья. Это новая модель помогает улучшить здоровье и благополучие широкого круга пользователей, включая тех, кто живет в удаленных регионах и имеет доступ к ограниченным здравоохранным ресурсам. ## Выводы Предложенный подход является новаторским в области здравоохранения, объединяя многомодальные данные для повышения личностных рекомендаций. Будущие исследования будут

Annotation:

Health is a fundamental pillar of human wellness, and the rapid advancements in large language models (LLMs) have driven the development of a new generation of health agents. However, the application of health agents to fulfill the diverse needs of individuals in daily non-clinical settings is underexplored. In this work, we aim to build a comprehensive personal health agent that is able to reason about multimodal data from everyday consumer wellness devices and common personal health records, a...

ID: 2508.20148v1 cs.AI, cs.HC, cs.MA

arXiv PDF

Показано 1 - 10 из 14 записей