Next Edit Prediction: Learning to Predict Code Edits from Context and Interaction History

2508.10074v1 cs.SE, cs.LG 2025-08-15
Авторы:

Ruofan Lu, Yintong Huo, Meng Zhang, Yichen Li, Michael R. Lyu

Резюме на русском

## Контекст Прогресс в области бо LARGE LANGUAGE MODELS (LLMs) положил начало новому поколению AI-powered coding assistants, которые внедрены в среды разработки. Однако существуют два основных подхода, которые, несмотря на свои преимущества, обладают ограничениями. Лот-латентность комплитиона (code completion) ограничивается контекстом текущего положения курсора, что делает его неэффективным для выполнения комплексных модификаций. Напротив, chat-based editing способен выполнять интенсивные модификации, но требует от разработчика прерывать свою работу, описывать намерение в естественном языке, что приводит к контекстному переключению и логическому разрыву. В результате, ни один из этих подходов не предлагает проактивного предсказания следующего шага разработчика в последовательности связанных работ. Для решения этой проблемы и введения более интерактивного подхода предлагается задача **Next Edit Prediction**, которая предназначена для прогнозирования следующей редакции кода на основе последних действий разработчика. ## Метод Для реализации задачи Next Edit Prediction была разработана методология, основанная на сборе и подготовке высококачественной данной для fine-tuning. Использовался машинное обучение с учителем (supervised learning) для обучения моделей, которые учитывают историю взаимодействия разработчика. Архитектура моделей включала в себя различные модели, такие как стандартные преобразовательные модели (transformers) и дополнительные модификации, специально разработанные для задачи. Данные для обучения были сформированы на основе реальных интеракций разработчиков, чтобы обеспечить реалистичность и актуальность прогнозируемых редакций. Этот подход имитирует реальность разработки и позволяет модели выучивать контекстные зависимости и структуры кода. ## Результаты В ходе экспериментов были проведены сравнительные оценки различных моделей, включая основные предложенные в работе, а также базовые модели для сравнения. Были измерены функции качества, такие как точность предсказания, предложенное решение взаимодействия, и скорость выполнения. Были получены результаты, показавшие значительные улучшения в точности и скорости прогнозирования следующих редакций в сравнении с базовыми моделями. Были сгенерированы визуализации, демонстрирующие то, как модель предсказывает следующие редакции, исходя из истории взаимодействий разработчика. Эти результаты указывают на высокую точность и эффективность моделей в решении задачи Next Edit Prediction. ## Значимость Предложенная модель имеет большое значение для развития AI-powered coding assistants, так как она делает инструменты более прогнозируемыми и интерактивными. Модель может быть применена в различных сценариях, таких как локальное разработческое окружение, обла

Abstract

The rapid advancement of large language models (LLMs) has led to the widespread adoption of AI-powered coding assistants integrated into a development environment. On one hand, low-latency code completion offers completion suggestions but is fundamentally constrained to the cursor's current position. On the other hand, chat-based editing can perform complex modifications, yet forces developers to stop their work, describe the intent in natural language, which causes a context-switch away from the code. This creates a suboptimal user experience, as neither paradigm proactively predicts the developer's next edit in a sequence of related edits. To bridge this gap and provide the seamless code edit suggestion, we introduce the task of Next Edit Prediction, a novel task designed to infer developer intent from recent interaction history to predict both the location and content of the subsequent edit. Specifically, we curate a high-quality supervised fine-tuning dataset and an evaluation benchmark for the Next Edit Prediction task. Then, we conduct supervised fine-tuning on a series of models and performed a comprehensive evaluation of both the fine-tuned models and other baseline models, yielding several novel findings. This work lays the foundation for a new interaction paradigm that proactively collaborate with developers by anticipating their following action, rather than merely reacting to explicit instructions.

Ссылки и действия