LinkAnchor: An Autonomous LLM-Based Agent for Issue-to-Commit Link Recovery

2508.12232v1 cs.SE, cs.AI 2025-08-19
Авторы:

Arshia Akhavan, Alireza Hosseinpour, Abbas Heydarnoori, Mehdi Keshani

Резюме на русском

## Контекст Область исследования связана с проблемами следимости и управления проектами в программном обеспечении. Задача связывания задач (issues) с коммитами (commits) является важной для обеспечения трассировки программного обеспечения и эффективного управления проектами. Несмотря на ее важность, восстановление связи между задачами и коммитами остается сложной задачей. На GitHub, лишь 42.2% задач связаны с корректными коммитами, что демонстрирует значительный потенциал для улучшения. Оптимальное решение этой проблемы может значительно повысить качество разработки программного обеспечения. ## Метод Методология LinkAnchor основывается на использовании бо LLM (Large Language Models). Этот подход использует архитектуру lazy-access, которая позволяет LLM динамически получать только самые актуальные контекстные данные, такие как коммиты, комментарии к задачам и код. Таким образом, LLM может работать с ограниченным контекстом, не ограничиваясь полным набором данных. Большая часть существующих методов работает с индивидуальными парами задач-коммитов, что неэффективно с учетом масштабов реальных репозиториев. LinkAnchor, напротив, автоматически определяет целевой коммит, избегая исчерпывающего поиска. ## Результаты В ходе экспериментов LinkAnchor был сравнен с текущими состоянием технологий в области связывания задач и коммитов. Использовались данные из реальных проектов на GitHub и Jira. Итоговые результаты показывают, что LinkAnchor превосходит состязающиеся методы, показывая значительные улучшения в Hit@1 score за счет точности и эффективности. Эти результаты демонстрируют значительное улучшение в сравнении с предыдущими подходами. ## Значимость LinkAnchor может применяться в различных сферах, включая проектное управление, трассировку программного обеспечения и системы управления репозиториями. Значительное преимущество LinkAnchor заключается в том, что он полностью автоматизирует процесс связывания задач и коммитов, что экономит время и улучшает точность. Его подход можно расширить на другие платформы, такие как GitLab или Bitbucket, что делает его широко применимым. ## Выводы LinkAnchor представляет собой новую модель для автоматизации связывания задач и коммитов в программном обеспечении. Он устанавливает новый стандарт в данной области, демонстрируя выдающиеся результаты в сравнении с состоянием технологий. Будущие исследования будут нацелены на расширение функциональности LinkAnchor и его применение в других платформах задачно-ориентированного программного обеспечения.

Abstract

Issue-to-commit link recovery plays an important role in software traceability and improves project management. However, it remains a challenging task. A study on GitHub shows that only 42.2% of the issues are correctly linked to their commits. This highlights the potential for further development and research in this area. Existing studies have employed various AI/ML-based approaches, and with the recent development of large language models, researchers have leveraged LLMs to tackle this problem. These approaches suffer from two main issues. First, LLMs are constrained by limited context windows and cannot ingest all of the available data sources, such as long commit histories, extensive issue comments, and large code repositories. Second, most methods operate on individual issue-commit pairs; that is, given a single issue-commit pair, they determine whether the commit resolves the issue. This quickly becomes impractical in real-world repositories containing tens of thousands of commits. To address these limitations, we present LinkAnchor, the first autonomous LLM-based agent designed for issue-to-commit link recovery. The lazy-access architecture of LinkAnchor enables the underlying LLM to access the rich context of software, spanning commits, issue comments, and code files, without exceeding the token limit by dynamically retrieving only the most relevant contextual data. Additionally, LinkAnchor is able to automatically pinpoint the target commit rather than exhaustively scoring every possible candidate. Our evaluations show that LinkAnchor outperforms state-of-the-art issue-to-commit link recovery approaches by 60-262% in Hit@1 score across all our case study projects. We also publicly release LinkAnchor as a ready-to-use tool, along with our replication package. LinkAnchor is designed and tested for GitHub and Jira, and is easily extendable to other platforms.

Ссылки и действия