Building Self-Evolving Agents via Experience-Driven Lifelong Learning: A Framework and Benchmark
2508.19005v1
cs.AI, cs.CL
2025-08-28
Авторы:
Yuxuan Cai, Yipeng Hao, Jie Zhou, Hang Yan, Zhikai Lei, Rui Zhen, Zhenhua Han, Yutao Yang, Junsong Li, Qianjun Pan, Tianyu Huai, Qin Chen, Xin Li, Kai Chen, Bo Zhang, Xipeng Qiu, Liang He
Резюме на русском
## Контекст
Современные искусственные интеллекты (ИИ) становятся все более мощными в решении статических задач, однако ограничены в способности к продолжительному обучению и адаптации в динамичном мире. Это ограничение приводит к интенсивным исследованиям в области жизненного обучения (lifelong learning, LL), где целью является создание саморазвивающихся агентов, способных продолжительного развития в реальном мире. Несмотря на развитие техник LL, недостаточность текущих подходов в области создания агентов с продолжительным знанием, способных применять полученные умения в разнообразных контекстах, вызывает огромный интерес к развитию более развитых фреймворков и бенчмарков.
## Метод
Мы предлагаем Experience-driven Lifelong Learning (ELL) — расширенный фреймворк для создания саморазвивающихся агентов. Основанный на четырех основных принципах, ELL оптимизирует процесс обучения в динамичных средах:
1. **Experience Exploration**: Агенты активно исследуют среду, выявляют зависимости между задачами и строят траектории интерпретируемых опытов.
2. **Long-term Memory**: Агенты сохраняют и структурируют исторический опыт в персистентной памяти, включающей как персональные опыты, так и доменные знания.
3. **Skill Learning**: Агенты абстрагируют рекуррентные модели из опыта, активно рефинеют и валидируют их в новых задачах.
4. **Knowledge Internalization**: Агенты превращают экспериментальные опыты в неявные способности, доступные для быстрого использования в разных условиях.
Мы также представляем StuLife, бенчмарк для ELL, который основывается на симуляции жизненного пути студента, структурированного по трем главным парадигмам: от противостояния пассивности к проактивности, от контекста к памяти, и от имитации к настоящему обучению. В этой модели агенты должны приобретать практические умения, поддерживать хронологию и принимать решения в условиях меняющегося мира.
## Результаты
Мы провели эксперименты с StuLife, рассматривая данные о жизненном пути студента и экспериментируя с различными моделями жизненного обучения. Результаты показали, что модели, основанные на ELL, показывают выдающиеся результаты в области сохранения памяти, передачи умений и самостоятельного развития. Мы также оценили StuLife с использованием современных моделей LL, что позволило изучить значительный уровень прогресса в области жизненного обучения.
## Значимость
ELL может применяться в различных сферах, включая социальные сети, машинное обучение, а также развитие роботов и систем самоуправления. Его особенностью является способность создавать агенты, которые не только решают задачи, но и приобретают умения в процессе адаптации к обнов
Abstract
As AI advances toward general intelligence, the focus is shifting from
systems optimized for static tasks to creating open-ended agents that learn
continuously. In this paper, we introduce Experience-driven Lifelong Learning
(ELL), a framework for building self-evolving agents capable of continuous
growth through real-world interaction. The framework is built on four core
principles: (1) Experience Exploration: Agents learn through continuous,
self-motivated interaction with dynamic environments, navigating interdependent
tasks and generating rich experiential trajectories. (2) Long-term Memory:
Agents preserve and structure historical knowledge, including personal
experiences, domain expertise, and commonsense reasoning, into a persistent
memory system. (3) Skill Learning: Agents autonomously improve by abstracting
recurring patterns from experience into reusable skills, which are actively
refined and validated for application in new tasks. (4) Knowledge
Internalization: Agents internalize explicit and discrete experiences into
implicit and intuitive capabilities as "second nature".
We also introduce StuLife, a benchmark dataset for ELL that simulates a
student's holistic college journey, from enrollment to academic and personal
development, across three core phases and ten detailed sub-scenarios. StuLife
is designed around three key paradigm shifts: From Passive to Proactive, From
Context to Memory, and From Imitation to Learning. In this dynamic environment,
agents must acquire and distill practical skills and maintain persistent memory
to make decisions based on evolving state variables. StuLife provides a
comprehensive platform for evaluating lifelong learning capabilities, including
memory retention, skill transfer, and self-motivated behavior. Beyond
evaluating SOTA LLMs on the StuLife benchmark, we also explore the role of
context engineering in advancing AGI.
Ссылки и действия
Дополнительные ресурсы: