SurveyGen-I: Consistent Scientific Survey Generation with Evolving Plans and Memory-Guided Writing

2508.14317v1 cs.CL, cs.IR 2025-08-22
Авторы:

Jing Chen, Zhiheng Yang, Yixian Shen, Jie Liu, Adam Belloum, Chrysa Papagainni, Paola Grosso

Резюме на русском

#### Контекст Сборники научных статей (survey papers) являются важной частью научной связи, поскольку они охватывают и синтезируют развитие в конкретной области. Однако создание таких статей требует огромных затрат времени и усилий, так как требуется тщательная аналитика, упорядочение и синтез информации. Несмотря на то, что Large Language Models (LLMs) успешно применяются в многих научных задачах, их применение для автоматизации создания сборников статей сталкивается с рядом проблем. Это включает проблемы с поддержкой логической консистентности в длинных, многосекционных статьях, а также недостаточное распространение источников в сформированных скелетах. SurveyGen-I предлагает новый подход к автоматическому созданию консистентных научных сборников, адресуя эти проблемы с помощью методики, которая объединяет инновационные техники для построения плана, адаптивного рефининга и запоминания контекста при генерации текста. #### Метод SurveyGen-I является полностью автоматизированным фреймворком для создания научных статей, который использует три главных компонента: широковещательный и точный поиск, адаптивное планирование и механизм запоминания. На первом этапе, SurveyGen-I использует широковещательный поиск для построения первоначальной структуры статьи, основываясь на начальных запросах. Затем, в процессе генерации текста, механизм запоминания позволяет системе поддерживать логическую последовательность уже созданных секций. Когда генерация отклоняется от целевого плана, SurveyGen-I использует точный поиск для исправления отклонений. Это интегрированное решение, включающее в себя оптимизации планирования и генерации, позволяет SurveyGen-I создавать научные статьи с высокой консистентностью, высоким качеством и более широким затрагиванием источников. #### Результаты Для оценки SurveyGen-I, авторы провели эксперименты на категориях научных статей из четырех различных областей наук. Наборы данных, использованные в этих экспериментах, включали в себя как общие, так и специализированные тексты, чтобы протестировать систему в разных условиях. В результате, SurveyGen-I не только превзошла предыдущие лидеры в этой области по таким критериям, как качество текста, консистентность и количество упоминаний источников, но и доказала свой прирост в эффективности при генерации более структурированных и полных сборников. #### Значимость SurveyGen-I широко применимо в научной сфере, где автоматизация процессов генерации научных статей может существенно уменьшить время и силы, потраченные на ручную работу. Он заметно повышает качество и полноту статей, что может быть критично для скорости разви

Abstract

Survey papers play a critical role in scientific communication by consolidating progress across a field. Recent advances in Large Language Models (LLMs) offer a promising solution by automating key steps in the survey-generation pipeline, such as retrieval, structuring, and summarization. However, existing LLM-based approaches often struggle with maintaining coherence across long, multi-section surveys and providing comprehensive citation coverage. To address these limitations, we introduce SurveyGen-I, an automatic survey generation framework that combines coarse-to-fine retrieval, adaptive planning, and memory-guided generation. SurveyGen-I first performs survey-level retrieval to construct the initial outline and writing plan, and then dynamically refines both during generation through a memory mechanism that stores previously written content and terminology, ensuring coherence across subsections. When the system detects insufficient context, it triggers fine-grained subsection-level retrieval. During generation, SurveyGen-I leverages this memory mechanism to maintain coherence across subsections. Experiments across four scientific domains demonstrate that SurveyGen-I consistently outperforms previous works in content quality, consistency, and citation coverage.

Ссылки и действия