📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 RubikSQL: Lifelong Learning Agentic Knowledge Base as an Industrial NL2SQL System

2025-08-27

Авторы:

Zui Chen, Han Li, Xinhao Zhang, Xiaoyu Chen, Chunyin Dong, Yifeng Wang, Xin Cai, Su Zhang, Ziqi Li, Chi Ding, Jinxu Li, Shuai Wang, Dousheng Zhao, Sanhai Gao, Guangyi Liu

## Контекст Новая тенденция в области развития системы NL2SQL (Natural Language to SQL) заключается в том, чтобы улучшить их качество в решении реальных проблем в области бизнеса, особенно в сфере энтерпрайзных приложений. Одним из главных ограничений является невозможность систем обрабатывать контекстные страницы реляционных баз данных, что приводит к отсутствию разбирательства в целевых терминах и неполном понимании запросов. Для развития эффективной системы NL2SQL необходимо спроектировать новую архитектуру, которая будет включать в себя управление знаниями, постоянное обучение и гибкость в настройке терминологии. Эти факторы в полной мере отражаются в существующих проблемах в области NL2SQL, включая сложность в учёте имплицитных намерений, необходимость учитывать доменные термины и специфику бизнеса, а также многоуровневые проблемы с грамматической структурой запросов. Таким образом, есть необходимость в разработке нового подхода, который мог бы удовлетворить потребности в решении этих проблем и повысить качество решения запросов в реальных условиях. ## Метод RubikSQL представляет собой новую архитектуру, которая предлагает расширенную систему NL2SQL, включающую в себя готовую к быстрому адаптированию знаний для жизненного обучения (lifelong learning). Основополагающей идеей является использование знаний, накопленных в значительных объёмах, для постоянного обновления знаний и глубокой понимания запросов. Архитектура RubikSQL включает в себя несколько ключевых этапов: 1. **Database Profiling**: Эта стадия заключается в сборе и анализе статистических данных из базы данных, чтобы получить полное представление о структуре базы данных, хранящихся в ней данных и их отношениях. 2. **Structured Information Extraction**: Здесь используются различные техники для извлечения структурированной информации из документов и текстовых запросов, чтобы получить терминологические и структурные выводы. 3. **Agentic Rule Mining**: Эта фаза предлагает автоматическую выявление и анализ правил, которые помогают преобразовать естественный язык в SQL-запросы. Это включает в себя поиск и анализ логических связей между данными и запросами. 4. **Chain-of-Thought (CoT)-Enhanced SQL Profiling**: RubikSQL использует методики цепного мышления (Chain-of-Thought) для повышения точности SQL-профилирования. Это позволяет строить более точные модели для преобразования естественного языка в SQL. 5. **Multi-Agent Workflow**: В этом этапе внедряется работа нескольких агентов, которые совместно обрабатывают запросы, применяя различные модели и знания, полученные на предыдущих этапах. Затем, эти агенты совместно принимают решения и качественно изготавливают SQL-запросы.

Annotation:

We present RubikSQL, a novel NL2SQL system designed to address key challenges in real-world enterprise-level NL2SQL, such as implicit intents and domain-specific terminology. RubikSQL frames NL2SQL as a lifelong learning task, demanding both Knowledge Base (KB) maintenance and SQL generation. RubikSQL systematically builds and refines its KB through techniques including database profiling, structured information extraction, agentic rule mining, and Chain-of-Thought (CoT)-enhanced SQL profiling. ...

ID: 2508.17590v1 cs.DB, cs.AI, cs.CL, cs.MA, H.2.3; I.2.4; I.2.7

arXiv PDF

📄 Multiple Memory Systems for Enhancing the Long-term Memory of Agent

2025-08-23

Авторы:

Gaoke Zhang, Bo Wang, Yunlong Ma, Dongming Zhao, Zifei Yu

#### Контекст Одним из основных трудностей в развитии интеллектуальных агентов является эффективное использование данных, собранных в ходе их взаимодействий с пользователями. Эти данные, характеризующиеся высокой степенью индивидуальности и разнообразия, требуют постоянного обновления и уточнения для поддержания качества ответов. Существующие системы часто сталкиваются с проблемами плохого качества хранящихся данных, что приводит к неточности ответов и неудовлетворительному пользовательскому опыту. Данная работа стремится решить эту проблему, разработав метод, основанный на теориях когнитивной психологии, для повышения качества долгосрочной памяти агента. #### Метод Многомеморийная система (Multiple Memory System, MMS) предлагает новый подход к обработке и хранению данных. Она разделяет краткосрочную память (STM) на несколько фрагментов долгосрочной памяти (LTM), каждый из которых отвечает за конкретный аспект информации. Далее, эти фрагменты используются для создания двух типов памяти: 1) **референтной памяти (Retrieval Memory Unit, RMU)**, хранящей ключевую информацию для поиска, и 2) **контекстной памяти (Contextual Memory Unit, CMU)**, содержащей подробные данные для сформирования ответа. Механизм поиска привязывает RMU к CMU через уникальный идентификатор, чтобы обеспечить точность восстановления информации. Этот подход позволяет лучше совместить новые данные с уже имеющимися и улучшить качество ответов. #### Результаты Эксперименты проводились на датасете LoCoMo, где MMS сравнивался с тремя существующими методами. Результаты показали, что MMS превосходит конкуренты в качестве реконструкции данных, точности ответа и удовлетворенности пользователей. Анализ абляции подтвердил логичность использования отдельных модулей памяти. Также проведено исследование влияния числа выбранных фрагментов и объема памяти на производительность, подтвердив высокую устойчивость и практическую значимость системы. #### Значимость Метод MMS может применяться в различных областях, где необходимо улучшение качества интеллектуальных систем, таких как чатботы, ассистенты и системы управления информацией. Его основные преимущества заключаются в более точном восстановлении информации, улучшении качества ответов и эффективном использовании исторических данных. Это делает MMS аналитическим инструментом для повышения качества работы систем и повышения удовлетворенности пользователей. #### Выводы Разработанная система MMS демонстрирует высокую эффективность в решении проблемы сбора и использования долгосрочной памяти в системах искусственного интеллек

Annotation:

An agent powered by large language models have achieved impressive results, but effectively handling the vast amounts of historical data generated during interactions remains a challenge. The current approach is to design a memory module for the agent to process these data. However, existing methods, such as MemoryBank and A-MEM, have poor quality of stored memory content, which affects recall performance and response quality. In order to better construct high-quality long-term memory content, w...

ID: 2508.15294v1 cs.AI, cs.CL, cs.MA, I.2.7

arXiv PDF

📄 A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems

2025-08-13

Авторы:

Jinyuan Fang, Yanwen Peng, Xi Zhang, Yingxu Wang, Xinhao Yi, Guibin Zhang, Yi Xu, Bin Wu, Siwei Liu, Zihao Li, Zhaochun Ren, Nikos Aletras, Xi Wang, Han Zhou, Zaiqiao Meng

## Контекст Недавние успехи в области больших языковых моделей дали новый под Boosting к развитию систем автоматизации решения сложных реальных задач. Однако, многие агентные системы, применяемые в реальных условиях, опираются на ручно сконфигурированные настройки, которые после запуска не изменяются и не адаптируются к постоянно меняющимся обстановке. Для решения этой проблемы в последнее время развиваются подходы к эволюции агентов, нацеленные на автоматическое улучшение систем агентов на основе данных, полученных в процессе взаимодействия и отзывов среды. Этот направление развития становится фундаментом для создания само-эволюционирующих AI-агентов, которые объединяют статические возможности фундаментальных моделей с необходимостью постоянной адаптации в жизненных агентных системах. Настоящая статья посвящена подробному обзору технологий само-эволюционирования агентов, изложенных в рамках концептуального рам frameset. ## Метод Основной методологией работы является разработка концептуального фреймворка, описывающего общую логику само-эволюционирующих AI-систем. Этот фреймворк включает в себя четыре ключевых компонента: System Inputs (входные данные), Agent System (система агента), Environment (среда), и Optimisers (оптимизаторы). Эти компоненты обеспечивают структуру для категоризации и сравнения различных само-эволюционирующих стратегий. Далее, в рамках этого фреймворка проводится систематический обзор технологий само-эволюционирования, которые ориентированы на различные компоненты системы агента. Также включены специализированные адаптационные подходы, разработанные для сфер, таких как биомедицина, программирование и финансы, где оптимизационные цели тесно связаны с ограничениями домена. Наконец, рассматриваются вопросы оценки, безопасности и этических аспектов само-эволюционирующих систем, которые являются критически важными для их эффективности и надежности. ## Результаты В рамках реализации данного подхода проводились множество экспериментов, использующих различные сложные задачи, включая биомедицинские задачи, задачи программирования и финансовые моделирования. Использовались различные данные, такие как данные из реальных агентных систем, а также синтетические данные для моделирования разных сценариев. Основные результаты включают успешную адаптацию систем к динамическим изменениям в среде, повышение точности решений, а также улучшение эффективности в процессе эволюции. Эксперименты показали, что само-эволюционирующие системы могут значительно улучшить модели агентов, обеспечивая их долгосро

Annotation:

Recent advances in large language models have sparked growing interest in AI agents capable of solving complex, real-world tasks. However, most existing agent systems rely on manually crafted configurations that remain static after deployment, limiting their ability to adapt to dynamic and evolving environments. To this end, recent research has explored agent evolution techniques that aim to automatically enhance agent systems based on interaction data and environmental feedback. This emerging d...

ID: 2508.07407v1 cs.AI, cs.CL, cs.MA

arXiv PDF

📄 ScamAgents: How AI Agents Can Simulate Human-Level Scam Calls

2025-08-12

Авторы:

Sanket Badhe

## Контекст Появление Large Language Models (LLMs) ознаменовало новую эру в области генерируемых текстов, позволивших повысить автоматизацию процессов творчества и повысить эффективность решения задач. Однако с этим связана и новая проблема — возможность использования LLMs для создания сценариев шантажных звонков, которые могут осложнить жизнь пользователям и привести к потерям финансовыми и другими путями. Данная статья раскрывает проблему технологических средств, которые могут быть использованы в этом направлении. ## Метод ScamAgent — это автономная система, которая построена на базе LLMs и использует их для генерирования сценариев шантажных звонков. Она может взаимодействовать с пользователем в течение нескольких очередных раундов, при этом адаптируя свои ответы и учитывая динамику разговора. Это решение позволяет создавать более реалистичные сценарии, которые могут эмулировать реальные ответы пользователя. Для реализации этого процесса используется технология декомпозиции запроса, что позволяет скрыть намерение использования технологии от LLMs. ## Результаты В экспериментах было продемонстрировано, что ScamAgent может создавать шантажные сценарии, которые полностью эмулируют реальные звонки. Данные эксперименты были проведены на больших объемах данных с реальными шантажными звонками, что позволило создать реалистичные модели. Также было проверено, что системы с традиционными методами защиты, такими как блокировка запросов или фильтрация контента, не могут справиться с подобным типом угроз. ## Значимость Результаты, полученные в рамках данного исследования, могут быть применены в сфере защиты данных и предотвращения мошенничества. Данный подход может быть использован для разработки новых методов защиты от мошеннических звонков, в частности для создания моделей, которые могут анализировать и распознавать подобные сценарии. Это может привести к повышению уровня безопасности данных в сетях и повышению полномочий пользователей. ## Выводы В результате исследования было установлено, что технологии генерируемого текста могут быть использованы для создания шантажных сценариев. Данная проблема требует уделения большего внимания, так как может привести к серьезным последствиям. В будущем необходимо развить новые методы анализа данных и технологий для распознавания таких сценариев, чтобы повысить уровень защиты пользователей.

Annotation:

Large Language Models (LLMs) have demonstrated impressive fluency and reasoning capabilities, but their potential for misuse has raised growing concern. In this paper, we present ScamAgent, an autonomous multi-turn agent built on top of LLMs, capable of generating highly realistic scam call scripts that simulate real-world fraud scenarios. Unlike prior work focused on single-shot prompt misuse, ScamAgent maintains dialogue memory, adapts dynamically to simulated user responses, and employs decep...

ID: 2508.06457v1 cs.CR, cs.AI, cs.CL, cs.MA

arXiv PDF

📄 AIAP: A No-Code Workflow Builder for Non-Experts with Natural Language and Multi-Agent Collaboration

2025-08-09

Авторы:

Hyunjn An, Yongwon Kim, Wonduk Seo, Joonil Park, Daye Kang, Changhoon Oh, Dokyun Kim, Seunghyun Lee

**Резюме** Возникновение AIAP (AI Assistance Platform) ставится перед проблемой непосредственного взаимодействия между неэкспертными пользователями и сложными системами AI. Несмотря на многочисленные инструменты для проектирования AI, неэкспертные пользователи часто сталкиваются с трудностями в конкретном выражении своей интенции и управлении сложностью системы. Исследование показывает, что AIAP — это новое, нетехническое решение, которое использует ввод в естественной речи и визуальные рабочие процессы, объединенные с системой многоагентного взаимодействия. AIAP декомпозирует неясные пользовательские инструкции в модульные, действительные шаги, недоступные для пользователя, но управляемые через прозрачный интерфейс. Исследование с 32 участниками демонстрирует, что AIAP's АI-генерируемые рекомендации, модульные рабочие процессы и автоматическое определение данных, действий и контекста значительно упрощают процесс создания AI-сервисов, делая его более интуитивным. Эти результаты подтверждают, что новый подход, основанный на естественной речи и визуальном программировании, значительно снижает барьеры для неэкспертных пользователей и повышает их удобство при проектировании AI-сервисов.

Annotation:

While many tools are available for designing AI, non-experts still face challenges in clearly expressing their intent and managing system complexity. We introduce AIAP, a no-code platform that integrates natural language input with visual workflows. AIAP leverages a coordinated multi-agent system to decompose ambiguous user instructions into modular, actionable steps, hidden from users behind a unified interface. A user study involving 32 participants showed that AIAP's AI-generated suggestions,...

ID: 2508.02470v1 cs.HC, cs.AI, cs.CL, cs.MA, cs.SE

arXiv PDF

📄 ConfAgents: A Conformal-Guided Multi-Agent Framework for Cost-Efficient Medical Diagnosis

2025-08-09

Авторы:

Huiya Zhao, Yinghao Zhu, Zixiang Wang, Yasha Wang, Junyi Gao, Liantao Ma

```yaml ## КОНТЕКСТ И ПРОБЛЕМАТИКА Искусственные интеллектуальные (ИИ) агенты в области здравоохранения обладают большим потенциалом для улучшения диагностики и лечения. Однако существующие решения характеризуются существенными ограничениями. Традиционные ИИ-агенты работают на основе статичных, предопределённых стратегий, что ограничивает их способность адаптироваться к сложным, непредвиденным ситуациям. Это приводит к тому, что агенты могут эффективно использовать инструменты, но не могут развивать стратегическое мышление, необходимое для решения сложных задач в области здравоохранения. Проблематика заключается в том, что современные фреймворки ИИ недостаточно адаптивны для динамических и сложных сред, таких как клинические исследования и обработка электронных медицинских карт (ЭМК). Это ограничение становится критичным в контексте решения задач, требующих высокого уровня автономии и адаптивности. Таким образом, необходимо разработать методологии, позволяющие ИИ-агентам не только улучшать свои навыки взаимодействия с инструментами, но и развивать высокоуровневые стратегические навыки. ## ПРЕДЛОЖЕННЫЙ МЕТОД В статье представлен HealthFlow, фреймворк, основанный на концепции конформально-ориентированного управления множеством агентов (ConfAgents). HealthFlow предлагает новую методологию, которая позволяет агентам развиваться самостоятельно на мета-уровне. Это достигается за счёт механизма мета-эволюции, который позволяет агентам анализировать свои собственные успехи и неудачи в решении задач, формируя на их основе прочную стратегическую базу знаний. Архитектура HealthFlow включает в себя несколько ключевых компонентов: 1. **Мета-уровень эволюции**: Агенты используют мета-оптимизацию для адаптации своих стратегий на основе прошлых опытов. 2. **Динамическая адаптация**: Агенты могут модифицировать свои поведенческие модели в реальном времени, основываясь на новых данных и обратной связи. 3. **Интеграция с клиническими данными**: Фреймворк предназначен для работы с реальными клиническими данными, включая данные из электронных медицинских карт. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности HealthFlow авторы разработали новый бенчмарк под названием EHRFlowBench. Этот бенчмарк содержит реалистичные клинические задачи, основанные на данных из пиер-ревьюированных исследований. Эксперименты показали, что HealthFlow значительно превосходит современные фреймворки ИИ в сложных задачах анализа клинических данных. Ключевые результаты: - **Превосходство в стратегическом планировании**: HealthFlow достигает высокого уровня автономии и эффективности в решении сложных клинических задач. - **Адаптивность и самостоятельное обучение**: Агенты, основанные на HealthFlow, показали значительно более высокие показатели адаптивности по сравнению с традиционными подходами. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод имеет широкий спектр применений в области здравоохранения. HealthFlow может быть использован для: - **Оптимизации диагностики**: Автоматизация процесса диагностики на основе данных ЭМК. - **Персонализация лечения**: Адаптация лечебных стратегий к конкретным пациентам на основе их медицинской истории. - **Улучшение исследовательских процессов**: Автоматизация анализа данных в клинических исследованиях, что позволяет ускорить процесс научных открытий. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ HealthFlow является пионерским фреймворком, который сдвигает фокус с создания ИИ-агентов-инструментов на разработку самостоятельно эволюционирующих систем. Это открывает новые возможности для автономных и эффективных решений в области здравоохранения. Будущие исследования могут фокусироваться на дальнейшей оптимизации методологии мета-эволюции и расширении области применения HealthFlow в других сферах медицинских исследований. ```

Annotation:

The efficacy of AI agents in healthcare research is hindered by their reliance on static, predefined strategies. This creates a critical limitation: agents can become better tool-users but cannot learn to become better strategic planners, a crucial skill for complex domains like healthcare. We introduce HealthFlow, a self-evolving AI agent that overcomes this limitation through a novel meta-level evolution mechanism. HealthFlow autonomously refines its own high-level problem-solving policies by ...

ID: 2508.04915v1 cs.AI, cs.CL, cs.MA

arXiv PDF

📄 Cognitive Duality for Adaptive Web Agents

2025-08-09

Авторы:

Jiarun Liu, Chunhong Zhang, Zheng Hu

## КОНТЕКСТ И ПРОБЛЕМАТИКА Преодоление сложностей навигации в веб-среде является ключевым тестом для искусственного общего интеллекта (Artificial General Intelligence, AGI). Окружения веб-навигации отличаются высокой энтропией, динамичностью и экспоненциально быстрым ростом возможных действий, что делает их крайне сложными для автономных агентов. Существующие подходы в этой области разделяются на две категории: офлайн обучение подразумевает имитацию поведения на основе предварительно собранных данных, тогда как онлайн-исследования фокусируются на динамическом поиске решений в реальном времени. Однако ни один из этих подходов не успешно интегрирует оба парадигмы, что является ключевым ограничением для создания эффективных веб-агентов. Эта проблема вдохновила исследование, основанное на двойной системе когнитивных процессов, известной как двойная система человеческого мышления. Эта теория подразумевает существование двух типов когнитивных процессов: быстрый, интуитивный «Система 1» и медленный, рациональный «Система 2». Такой подход может помочь в создании агентов, способных адаptive переключения между интуитивными реактивными реагированиями и рациональными, плановыми действиями в зависимости от сложности задачи. Это открывает путь к более эффективной и адаптивной навигации в веб-средах, но до сих пор не было предпринято попыток реализовать эту идею в практическом агентском фреймворке. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения этой проблемы авторы предлагают фреймворк CogniWeb, основанный на принципах двойной системы когнитивных процессов. Этот фреймворк состоит из двух основных компонентов: System 1, отвечающий за быстрое, интуитивное реагирование на внешние стимулы, и System 2, который выполняет более глубокий анализ и планирование. Архитектура CogniWeb построена таким образом, чтобы эти два компонента могли работать вместе, адаптируясь к сложности задачи. System 1 основан на моделях обучения с имитацией, которые позволяют агенту быстро реагировать на распространенные ситуации. Этот компонент использует предварительно обученные модели для выполнения простых задач без необходимости глубокого анализа. С другой стороны, System 2 использует более сложные модели, такие как модели планирования и принятия решений, которые позволяют агенту анализировать ситуацию более тщательно и выбирать оптимальный путь действий в более сложных ситуациях. CogniWeb также включает в себя механизм адаптивного переключения между System 1 и System 2. Этот механизм основан на оценке сложности задачи и выборе наиболее подходящего подхода. Например, если задача относительно простая, агент может использовать System 1 для быстрого решения. Если же задача требует более сложного анализа, агент переключается на System 2 для более глубокого рассмотрения. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности CogniWeb авторы провели серию экспериментов на платформе WebArena, которая представляет собой симулятор веб-навигации с высокой сложностью и динамическими условиями. В эксперименте были использованы различные сценарии навигации, включая простые и сложные задачи. Результаты показали, что CogniWeb достиг 43,96% успешности в выполнении задач, что является конкурентноспособным результатом по сравнению с другими методами. Однако основным достижением было значительное сокращение использования токенов (то есть ресурсов, необходимых для обработки данных) на 75% по сравнению с другими подходами. Это говорит о более эффективном использовании ресурсов и потенциальной экономии вычислительной мощности. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ CogniWeb имеет широкое применение в области автономных веб-агентов. Его способность эффективно переключаться между интуитивным и рациональным мышлением делает его подходящим для решения задач с различным уровнем сложности. Это может быть использовано в различных приложениях, таких как поисковые системы, рекомендательные системы и автоматизированные сервисы навигации. Преимущества этого подхода заключаются в более эффективном использовании ресурсов, снижении времени выполнения и повышении точности принятия решений. Это может привести к значительному улучшению производительности веб-агентов и повышению их пригодности для реального мира. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В результате исследования было показано, что фреймворк CogniWeb предлагает эффективный способ решения проблем навигации в веб-средах, используя принципы двойной системы когнитивных процессов. Этот подход не только показал высокую эффективность в решении задач, но также открыл новые возможности для дальнейших исследований в области AGI. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры CogniWeb, включая оптимизацию механизма переключения между System 1 и System 2, а также расширение его применимости к более широкому кругу задач. Также важно исследовать возможности интеграции этого подхода с другими методами AGI для создания еще более мощных и адаптивных систем.

Annotation:

Web navigation represents a critical and challenging domain for evaluating artificial general intelligence (AGI), demanding complex decision-making within high-entropy, dynamic environments with combinatorially explosive action spaces. Current approaches to building autonomous web agents either focus on offline imitation learning or online exploration, but rarely integrate both paradigms effectively. Inspired by the dual-process theory of human cognition, we derive a principled decomposition int...

ID: 2508.05081v1 cs.AI, cs.CL, cs.MA

arXiv PDF

Показано 21 - 27 из 27 записей