Large Language Models for Software Testing: A Research Roadmap

2509.25043v1 cs.SE, cs.AI 2025-10-01
Авторы:

Cristian Augusto, Antonia Bertolino, Guglielmo De Angelis, Francesca Lonetti, Jesús Morán

Резюме на русском

## Контекст Large Language Models (LLMs) являются одним из самых значительных исследовательских направлений в области тестирования программного обеспечения. Они успешно применяются для выполнения задач, таких как генерация тестовых кодов и сводка документации. Этот потенциал привлек сотни исследователей, что привело к появлению десятков новых работ каждый месяц. Однако до сих пор не было обзора, описывающего область LLMs в тестировании программного обеспечения в подробном и структурированном виде. В настоящей статье предлагается такой обзор, предоставляя план развития LLMs в этой области, категоризируя существующие работы и определяя активные направления исследований. Данный подход позволяет понять текущее состояние LLMs в тестировании, а также определить долгосрочные возможности и вызовы. ## Метод Чтобы получить общее представление о росте LLMs в тестировании программного обеспечения, авторы проводили поиск и анализ статей, используя семи-систематическую литературную revue. Они структурировали работы по разным темам, описывая текущий статус LLMs в тестировании программного обеспечения, а также исследовали направления для дальнейших исследований. Архитектура исследования включает в себя два этапа: сбор статей и оценку их качества, а также анализ и группировку по темам, чтобы получить полное представление о текущем состоянии LLMs в тестировании программного обеспечения. ## Результаты В ходе работы были идентифицированы и анализированы многочисленные работы, выделив основные категории, такие как генерация тестовых кодов, динамическое тестирование, анализ требований и документации. Было установлено, что LLMs показывают эффективность в таких задачах, как генерация упрощенных тестовых сценариев, а также в автоматизации рутинных задач тестирования. Несмотря на прогресс, были выявлены некоторые проблемы, такие как недостаточная точность в генерации кода и недостаток широкой выборки для тестирования LLMs-приложений. ## Значимость LLMs могут быть применены в различных сферах тестирования, включая автоматизированную генерацию тестовых сценариев, тестирование адаптивности и работу с документацией. Они облегчают процессы, делают их более эффективными и уменьшают время, потраченное на рутинные задачи тестирования. Лонгитюдное влияние LLMs может быть относительно трансформации процессов тестирования программного обеспечения, повышением уровня автоматизации и повышением качества продуктов, создаваемых благодаря LLMs. ## Выводы Основными достижениями в сфере LLMs в тестировании являются прогресс в генерации тестовых кодов, улучшение анализа

Abstract

Large Language Models (LLMs) are starting to be profiled as one of the most significant disruptions in the Software Testing field. Specifically, they have been successfully applied in software testing tasks such as generating test code, or summarizing documentation. This potential has attracted hundreds of researchers, resulting in dozens of new contributions every month, hardening researchers to stay at the forefront of the wave. Still, to the best of our knowledge, no prior work has provided a structured vision of the progress and most relevant research trends in LLM-based testing. In this article, we aim to provide a roadmap that illustrates its current state, grouping the contributions into different categories, and also sketching the most promising and active research directions for the field. To achieve this objective, we have conducted a semi-systematic literature review, collecting articles and mapping them into the most prominent categories, reviewing the current and ongoing status, and analyzing the open challenges of LLM-based software testing. Lastly, we have outlined several expected long-term impacts of LLMs over the whole software testing field.

Ссылки и действия