Nemori: Self-Organizing Agent Memory Inspired by Cognitive Science

2508.03341v2 cs.AI 2025-08-09
Авторы:

Jiayan Nan, Wenquan Ma, Wenlong Wu, Yize Chen

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Распространение Large Language Models (LLMs) открыло новые возможности для разработки автономных агентов, способных вести динамические, долгосрочные взаимодействия с пользователями. Однако одной из ключевых проблем, ограничивающих эффективность LLMs в таких сценариях, является их неспособность поддерживать постоянную память в длинных контекстах. Традиционные подходы к управлению памятью в LLMs зависят от произвольной гранулярности при определении базовых единиц памяти и используют пассивные, правиловые механизмы для извлечения информации. Эти ограничения не позволяют моделям эффективно адаптироваться к динамическим, долгосрочным рабочим процессам, что снижает их практическую применимость. Для решения этой проблематики необходим метод, который мог бы организовывать информацию в памяти агента на основе семантических принципов, а не произвольных правил. Также важно обеспечить активный процесс обучения, позволяющий модели активно адаптироваться к новым ситуациям и улучшать свои знания на основе ошибок. На основе этих требований была разработка архитектуры Nemori, вдохновленная принципами когнитивной науки. ## ПРЕДЛОЖЕННЫЙ МЕТОД Nemori представляет новую архитектуру памяти, основанную на двух ключевых принципах. Первый — **Two-Step Alignment Principle**, вдохновленный теорией сегментации событий (Event Segmentation Theory). Этот принцип позволяет автоматически организовывать неструктурированный поток диалогов в семантически согласованные эпизоды, решая проблему гранулярности памяти. Эта процедура разбиения на эпизоды основывается на топорном анализе событий, что обеспечивает высокую семантическую консистенцию. Второй принцип — **Predict-Calibrate Principle**, вдохновленный Free-energy Principle. Этот механизм позволяет агенту активно учиться на основе прогнозных ошибок, преобразуя их в возможности для адаптации и эволюции своих знаний. Агент не только фиксирует новую информацию, но и проверяет свои прогнозы на основе контекста, корректируя свои знания в процессе взаимодействия. Архитектура Nemori сочетает эти принципы в единой системе, которая позволяет агенту динамически организовывать и адаптировать свою память в ответ на изменчивые условия. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности Nemori были проведены эксперименты на двух бенчмарках: LoCoMo и LongMemEval. Эти бенчмарки предназначены для оценки способности моделей обрабатывать длинные контексты и долгосрочные взаимодействия. Nemori демонстрирует значительное превосходство над предыдущими государственными решениями, особенно в ситуациях с длинными контекстами. Результаты показывают, что Nemori не только лучше организовывает память, но и демонстрирует улучшенную способность к адаптации и обучению в реальном времени. Это обеспечивает значительное увеличение точности и согласованности в долгосрочных взаимодействиях. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Nemori имеет широкий спектр применений в областях, требующих долгосрочного взаимодействия, таких как поддержка клиентов, образование и здравоохранение. Его способность активно адаптироваться и эволюционировать делает его идеальным инструментом для автономных агентов, которые должны обрабатывать сложные, динамические рабочие процессы. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Nemori является значительным шагом вперед в области автономных агентов, основанных на LLMs. Его инновационные принципы обеспечивают эффективное управление памятью и адаптацию к динамическим условиям. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры и расширении ее применения в реальных сценариях.

Abstract

Large Language Models (LLMs) demonstrate remarkable capabilities, yet their inability to maintain persistent memory in long contexts limits their effectiveness as autonomous agents in long-term interactions. While existing memory systems have made progress, their reliance on arbitrary granularity for defining the basic memory unit and passive, rule-based mechanisms for knowledge extraction limits their capacity for genuine learning and evolution. To address these foundational limitations, we present Nemori, a novel self-organizing memory architecture inspired by human cognitive principles. Nemori's core innovation is twofold: First, its Two-Step Alignment Principle, inspired by Event Segmentation Theory, provides a principled, top-down method for autonomously organizing the raw conversational stream into semantically coherent episodes, solving the critical issue of memory granularity. Second, its Predict-Calibrate Principle, inspired by the Free-energy Principle, enables the agent to proactively learn from prediction gaps, moving beyond pre-defined heuristics to achieve adaptive knowledge evolution. This offers a viable path toward handling the long-term, dynamic workflows of autonomous agents. Extensive experiments on the LoCoMo and LongMemEval benchmarks demonstrate that Nemori significantly outperforms prior state-of-the-art systems, with its advantage being particularly pronounced in longer contexts.

Ссылки и действия