Building Self-Evolving Agents via Experience-Driven Lifelong Learning: A Framework and Benchmark

2508.19005v1 cs.AI, cs.CL 2025-08-28
Авторы:

Yuxuan Cai, Yipeng Hao, Jie Zhou, Hang Yan, Zhikai Lei, Rui Zhen, Zhenhua Han, Yutao Yang, Junsong Li, Qianjun Pan, Tianyu Huai, Qin Chen, Xin Li, Kai Chen, Bo Zhang, Xipeng Qiu, Liang He

Резюме на русском

## Контекст Современные искусственные интеллекты (ИИ) становятся все более мощными в решении статических задач, однако ограничены в способности к продолжительному обучению и адаптации в динамичном мире. Это ограничение приводит к интенсивным исследованиям в области жизненного обучения (lifelong learning, LL), где целью является создание саморазвивающихся агентов, способных продолжительного развития в реальном мире. Несмотря на развитие техник LL, недостаточность текущих подходов в области создания агентов с продолжительным знанием, способных применять полученные умения в разнообразных контекстах, вызывает огромный интерес к развитию более развитых фреймворков и бенчмарков. ## Метод Мы предлагаем Experience-driven Lifelong Learning (ELL) — расширенный фреймворк для создания саморазвивающихся агентов. Основанный на четырех основных принципах, ELL оптимизирует процесс обучения в динамичных средах: 1. **Experience Exploration**: Агенты активно исследуют среду, выявляют зависимости между задачами и строят траектории интерпретируемых опытов. 2. **Long-term Memory**: Агенты сохраняют и структурируют исторический опыт в персистентной памяти, включающей как персональные опыты, так и доменные знания. 3. **Skill Learning**: Агенты абстрагируют рекуррентные модели из опыта, активно рефинеют и валидируют их в новых задачах. 4. **Knowledge Internalization**: Агенты превращают экспериментальные опыты в неявные способности, доступные для быстрого использования в разных условиях. Мы также представляем StuLife, бенчмарк для ELL, который основывается на симуляции жизненного пути студента, структурированного по трем главным парадигмам: от противостояния пассивности к проактивности, от контекста к памяти, и от имитации к настоящему обучению. В этой модели агенты должны приобретать практические умения, поддерживать хронологию и принимать решения в условиях меняющегося мира. ## Результаты Мы провели эксперименты с StuLife, рассматривая данные о жизненном пути студента и экспериментируя с различными моделями жизненного обучения. Результаты показали, что модели, основанные на ELL, показывают выдающиеся результаты в области сохранения памяти, передачи умений и самостоятельного развития. Мы также оценили StuLife с использованием современных моделей LL, что позволило изучить значительный уровень прогресса в области жизненного обучения. ## Значимость ELL может применяться в различных сферах, включая социальные сети, машинное обучение, а также развитие роботов и систем самоуправления. Его особенностью является способность создавать агенты, которые не только решают задачи, но и приобретают умения в процессе адаптации к обнов

Abstract

As AI advances toward general intelligence, the focus is shifting from systems optimized for static tasks to creating open-ended agents that learn continuously. In this paper, we introduce Experience-driven Lifelong Learning (ELL), a framework for building self-evolving agents capable of continuous growth through real-world interaction. The framework is built on four core principles: (1) Experience Exploration: Agents learn through continuous, self-motivated interaction with dynamic environments, navigating interdependent tasks and generating rich experiential trajectories. (2) Long-term Memory: Agents preserve and structure historical knowledge, including personal experiences, domain expertise, and commonsense reasoning, into a persistent memory system. (3) Skill Learning: Agents autonomously improve by abstracting recurring patterns from experience into reusable skills, which are actively refined and validated for application in new tasks. (4) Knowledge Internalization: Agents internalize explicit and discrete experiences into implicit and intuitive capabilities as "second nature". We also introduce StuLife, a benchmark dataset for ELL that simulates a student's holistic college journey, from enrollment to academic and personal development, across three core phases and ten detailed sub-scenarios. StuLife is designed around three key paradigm shifts: From Passive to Proactive, From Context to Memory, and From Imitation to Learning. In this dynamic environment, agents must acquire and distill practical skills and maintain persistent memory to make decisions based on evolving state variables. StuLife provides a comprehensive platform for evaluating lifelong learning capabilities, including memory retention, skill transfer, and self-motivated behavior. Beyond evaluating SOTA LLMs on the StuLife benchmark, we also explore the role of context engineering in advancing AGI.

Ссылки и действия