When Agents go Astray: Course-Correcting SWE Agents with PRMs
2509.02360v1
cs.AI, cs.SE
2025-09-05
Авторы:
Shubham Gandhi, Jason Tsay, Jatin Ganhotra, Kiran Kate, Yara Rizk
Резюме на русском
####################
## Контекст
####################
Подробное описание области исследования, существующих проблем и мотивации
На данный момент, большинство Large Language Model (LLM) agent'ов используются для решения сложных задач в области software engineering (SWE). Однако, их работа часто характеризуется неэффективностью: повторные эксперименты, зацикливания и невозможность остановиться после достижения решения. Эти проблемы становятся еще более заметными при работе с задачами, требующими нескольких шагов.
Попытки решения этой проблемы, в основном, ограничиваются пост-решательным анализом: проблемы выявляются только после завершения работы. Это приводит к потере времени и ресурсов, поскольку ошибки могут быть выявлены только после неудачного завершения задачи.
Мы предлагаем SWE-PRM — модель PRM, работающую во время выполнения, которая вводится в конечный этап работы модели. PRM использует широкую категоризацию распространенных неэффективностей и предлагает способы их корректировки. Это решение позволяет предотвратить ошибки на ранней стадии и улучшить эффективность работы модели.
####################
## Метод
####################
Детальное описание методологии, технических решений и архитектуры
Мы представляем SWE-PRM, модель, которая работает во время выполнения и использует Process Reward Model (PRM) для мониторинга и корректировки траектории работы LLM agent'а в реальном времени. Ее основным элементом является таксономия распространенных неэффективностей, таких как зацикливание, ненужное исследование и невозможность остановиться после достижения решения.
SWE-PRM использует данные, полученные на протяжении работы модели, и проверяет ее на соответствие установленным критериям. Если выявляются неэффективности, модель предлагает корректировки, которые могут включать изменение направления работы или остановку некоторых действий.
Такой подход позволяет минимизировать потери времени и ресурсов, связанные с необходимостью запускать задачу заново. Кроме того, SWE-PRM предоставляет интерпретируемую обратную связь, которая может быть использована для дальнейшего понимания и улучшения моделей.
####################
## Результаты
####################
Описание экспериментов, используемых данных и полученных результатов
Мы проводили эксперименты на SWE-Bench Verified, используя закрытые системы PRM. Результаты показывают, что SWE-PRM улучшает результаты работы моделей: с 40.0% до 50.6% на задачах средней и трудной сложности. Это подтверждает эффективность PRM в предотвращении неэффективных действий и уменьшении требуемого времени.
Мы также проверили различные стратегии обратной связи. Таксономические PRM вы mosterred the best performance, снизив стоимость выполнения задачи и увеличив успешность ра
Abstract
Large Language Model (LLM) agents are increasingly deployed for complex,
multi-step software engineering (SWE) tasks. However, their trajectories often
contain costly inefficiencies, such as redundant exploration, looping, and
failure to terminate once a solution is reached. Prior work has largely treated
these errors in a post-hoc manner, diagnosing failures only after execution. In
this paper, we introduce SWE-PRM, an inference-time Process Reward Model (PRM)
that intervenes during execution to detect and course-correct trajectory-level
errors. Our PRM design leverages a taxonomy of common inefficiencies and
delivers lightweight, interpretable feedback without modifying the underlying
policy. On SWE-bench Verified, closed-source PRMs improve resolution from 40.0%
to 50.6% (+10.6 p.p.), with the largest gains on medium and hard tasks. Among
feedback strategies, taxonomy-guided PRMs outperform unguided or explicit
action-prescriptive variants, increasing success rate while reducing trajectory
length. These benefits come at an acceptable added inference cost of as low as
$0.2, making PRMs a practical and scalable mechanism for improving SWE agents'
reliability and efficiency.
Ссылки и действия
Дополнительные ресурсы: