Nemori: Self-Organizing Agent Memory Inspired by Cognitive Science
2508.03341v2
cs.AI
2025-08-09
Авторы:
Jiayan Nan, Wenquan Ma, Wenlong Wu, Yize Chen
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Распространение Large Language Models (LLMs) открыло новые возможности для разработки автономных агентов, способных вести динамические, долгосрочные взаимодействия с пользователями. Однако одной из ключевых проблем, ограничивающих эффективность LLMs в таких сценариях, является их неспособность поддерживать постоянную память в длинных контекстах. Традиционные подходы к управлению памятью в LLMs зависят от произвольной гранулярности при определении базовых единиц памяти и используют пассивные, правиловые механизмы для извлечения информации. Эти ограничения не позволяют моделям эффективно адаптироваться к динамическим, долгосрочным рабочим процессам, что снижает их практическую применимость.
Для решения этой проблематики необходим метод, который мог бы организовывать информацию в памяти агента на основе семантических принципов, а не произвольных правил. Также важно обеспечить активный процесс обучения, позволяющий модели активно адаптироваться к новым ситуациям и улучшать свои знания на основе ошибок. На основе этих требований была разработка архитектуры Nemori, вдохновленная принципами когнитивной науки.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Nemori представляет новую архитектуру памяти, основанную на двух ключевых принципах. Первый — **Two-Step Alignment Principle**, вдохновленный теорией сегментации событий (Event Segmentation Theory). Этот принцип позволяет автоматически организовывать неструктурированный поток диалогов в семантически согласованные эпизоды, решая проблему гранулярности памяти. Эта процедура разбиения на эпизоды основывается на топорном анализе событий, что обеспечивает высокую семантическую консистенцию.
Второй принцип — **Predict-Calibrate Principle**, вдохновленный Free-energy Principle. Этот механизм позволяет агенту активно учиться на основе прогнозных ошибок, преобразуя их в возможности для адаптации и эволюции своих знаний. Агент не только фиксирует новую информацию, но и проверяет свои прогнозы на основе контекста, корректируя свои знания в процессе взаимодействия.
Архитектура Nemori сочетает эти принципы в единой системе, которая позволяет агенту динамически организовывать и адаптировать свою память в ответ на изменчивые условия.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Для оценки эффективности Nemori были проведены эксперименты на двух бенчмарках: LoCoMo и LongMemEval. Эти бенчмарки предназначены для оценки способности моделей обрабатывать длинные контексты и долгосрочные взаимодействия. Nemori демонстрирует значительное превосходство над предыдущими государственными решениями, особенно в ситуациях с длинными контекстами.
Результаты показывают, что Nemori не только лучше организовывает память, но и демонстрирует улучшенную способность к адаптации и обучению в реальном времени. Это обеспечивает значительное увеличение точности и согласованности в долгосрочных взаимодействиях.
## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Nemori имеет широкий спектр применений в областях, требующих долгосрочного взаимодействия, таких как поддержка клиентов, образование и здравоохранение. Его способность активно адаптироваться и эволюционировать делает его идеальным инструментом для автономных агентов, которые должны обрабатывать сложные, динамические рабочие процессы.
## ВЫВОДЫ И ПЕРСПЕКТИВЫ
Nemori является значительным шагом вперед в области автономных агентов, основанных на LLMs. Его инновационные принципы обеспечивают эффективное управление памятью и адаптацию к динамическим условиям. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры и расширении ее применения в реальных сценариях.
Abstract
Large Language Models (LLMs) demonstrate remarkable capabilities, yet their
inability to maintain persistent memory in long contexts limits their
effectiveness as autonomous agents in long-term interactions. While existing
memory systems have made progress, their reliance on arbitrary granularity for
defining the basic memory unit and passive, rule-based mechanisms for knowledge
extraction limits their capacity for genuine learning and evolution. To address
these foundational limitations, we present Nemori, a novel self-organizing
memory architecture inspired by human cognitive principles. Nemori's core
innovation is twofold: First, its Two-Step Alignment Principle, inspired by
Event Segmentation Theory, provides a principled, top-down method for
autonomously organizing the raw conversational stream into semantically
coherent episodes, solving the critical issue of memory granularity. Second,
its Predict-Calibrate Principle, inspired by the Free-energy Principle, enables
the agent to proactively learn from prediction gaps, moving beyond pre-defined
heuristics to achieve adaptive knowledge evolution. This offers a viable path
toward handling the long-term, dynamic workflows of autonomous agents.
Extensive experiments on the LoCoMo and LongMemEval benchmarks demonstrate that
Nemori significantly outperforms prior state-of-the-art systems, with its
advantage being particularly pronounced in longer contexts.
Ссылки и действия
Дополнительные ресурсы: