When Agents go Astray: Course-Correcting SWE Agents with PRMs

2509.02360v1 cs.AI, cs.SE 2025-09-05
Авторы:

Shubham Gandhi, Jason Tsay, Jatin Ganhotra, Kiran Kate, Yara Rizk

Резюме на русском

#################### ## Контекст #################### Подробное описание области исследования, существующих проблем и мотивации На данный момент, большинство Large Language Model (LLM) agent'ов используются для решения сложных задач в области software engineering (SWE). Однако, их работа часто характеризуется неэффективностью: повторные эксперименты, зацикливания и невозможность остановиться после достижения решения. Эти проблемы становятся еще более заметными при работе с задачами, требующими нескольких шагов. Попытки решения этой проблемы, в основном, ограничиваются пост-решательным анализом: проблемы выявляются только после завершения работы. Это приводит к потере времени и ресурсов, поскольку ошибки могут быть выявлены только после неудачного завершения задачи. Мы предлагаем SWE-PRM — модель PRM, работающую во время выполнения, которая вводится в конечный этап работы модели. PRM использует широкую категоризацию распространенных неэффективностей и предлагает способы их корректировки. Это решение позволяет предотвратить ошибки на ранней стадии и улучшить эффективность работы модели. #################### ## Метод #################### Детальное описание методологии, технических решений и архитектуры Мы представляем SWE-PRM, модель, которая работает во время выполнения и использует Process Reward Model (PRM) для мониторинга и корректировки траектории работы LLM agent'а в реальном времени. Ее основным элементом является таксономия распространенных неэффективностей, таких как зацикливание, ненужное исследование и невозможность остановиться после достижения решения. SWE-PRM использует данные, полученные на протяжении работы модели, и проверяет ее на соответствие установленным критериям. Если выявляются неэффективности, модель предлагает корректировки, которые могут включать изменение направления работы или остановку некоторых действий. Такой подход позволяет минимизировать потери времени и ресурсов, связанные с необходимостью запускать задачу заново. Кроме того, SWE-PRM предоставляет интерпретируемую обратную связь, которая может быть использована для дальнейшего понимания и улучшения моделей. #################### ## Результаты #################### Описание экспериментов, используемых данных и полученных результатов Мы проводили эксперименты на SWE-Bench Verified, используя закрытые системы PRM. Результаты показывают, что SWE-PRM улучшает результаты работы моделей: с 40.0% до 50.6% на задачах средней и трудной сложности. Это подтверждает эффективность PRM в предотвращении неэффективных действий и уменьшении требуемого времени. Мы также проверили различные стратегии обратной связи. Таксономические PRM вы mosterred the best performance, снизив стоимость выполнения задачи и увеличив успешность ра

Abstract

Large Language Model (LLM) agents are increasingly deployed for complex, multi-step software engineering (SWE) tasks. However, their trajectories often contain costly inefficiencies, such as redundant exploration, looping, and failure to terminate once a solution is reached. Prior work has largely treated these errors in a post-hoc manner, diagnosing failures only after execution. In this paper, we introduce SWE-PRM, an inference-time Process Reward Model (PRM) that intervenes during execution to detect and course-correct trajectory-level errors. Our PRM design leverages a taxonomy of common inefficiencies and delivers lightweight, interpretable feedback without modifying the underlying policy. On SWE-bench Verified, closed-source PRMs improve resolution from 40.0% to 50.6% (+10.6 p.p.), with the largest gains on medium and hard tasks. Among feedback strategies, taxonomy-guided PRMs outperform unguided or explicit action-prescriptive variants, increasing success rate while reducing trajectory length. These benefits come at an acceptable added inference cost of as low as $0.2, making PRMs a practical and scalable mechanism for improving SWE agents' reliability and efficiency.

Ссылки и действия