Exploring the Potential of Large Language Models in Fine-Grained Review Comment Classification
2508.09832v1
cs.SE, cs.AI
2025-08-15
Авторы:
Linh Nguyen, Chunhua Liu, Hong Yi Lin, Patanamon Thongtanunam
Резюме на русском
## Контекст
Code review является ключевым элементом в процессе разработки программного обеспечения. Он позволяет идентифицировать проблемы в коде, обеспечивать качество и совместимость. Однако в ходе легковесных кодовых рецензий могут возникнуть проблемы, которые трудно автоматически идентифицировать с помощью существующих методов. Обычно для повышения эффективности кодовых рецензий используются методы автоматизации, основанные на машинном обучении. Однако существующие подходы, основанные на супервизированном машинном обучении, требуют больших объемов методически обработанных данных для эффективного обучения моделей. Данная статья исследует возможности использования бо LLM (больших языковых моделей) для классификации кодовых рецензий на 17 классов, чтобы улучшить качество анализа и автоматизации процесса кода.
## Метод
Мы использовали 17 кategorii кодовых рецензий, полученных из кодовых баз данных, для тренировки и тестирования бо LLM. Для обучения мы использовали большое объемом текстового кода и текстовые примеры кодовых рецензий. Мы разработали архитектуру модели, основываясь на Transformer, для повышения точности классификации. Мы провели эксперименты с различными вариантами параметров модели и затем сравнили результаты с текущим лучшим подходом.
## Результаты
Мы провели эксперименты с различными вариантами параметров модели и сравнили результаты с текущим лучшим подходом. Бо LLM показал высокую точность в классификации, повышая эффективность кода в 17 категориях. Особенно выдающиеся результаты были достигнуты в 5 самых важных классах, где традиционные методы сталкивались с проблемами из-за ограниченного объема обучающих данных. Бо LLM обеспечил более балансированную точность в классификации как высокочастотных, так и низкочастотных категорий.
## Значимость
Данный подход имеет значительное значение в развитии технологий кодовых рецензий. Он может быть применен в разных областях, таких как улучшение анализа кодового качества, автоматизация кодовых процессов и повышение производительности разработчиков. Выявленные преимущества LLMs включают более точную классификацию, более широкий спектр применения и высокую совместимость с разными типами данных. Эти результаты могут привести к улучшению кодовых рецензий и повышению качества программного обеспечения.
## Выводы
Мы доказали, что бо LLM могут представлять собой эффективное решение для классификации кодовых рецензий. Они обеспечивают более балансированную точность классификации, что делает их применимыми для различных типов кодовых рецензий. В будущем мы планируем расшири
Abstract
Code review is a crucial practice in software development. As code review
nowadays is lightweight, various issues can be identified, and sometimes, they
can be trivial. Research has investigated automated approaches to classify
review comments to gauge the effectiveness of code reviews. However, previous
studies have primarily relied on supervised machine learning, which requires
extensive manual annotation to train the models effectively. To address this
limitation, we explore the potential of using Large Language Models (LLMs) to
classify code review comments. We assess the performance of LLMs to classify 17
categories of code review comments. Our results show that LLMs can classify
code review comments, outperforming the state-of-the-art approach using a
trained deep learning model. In particular, LLMs achieve better accuracy in
classifying the five most useful categories, which the state-of-the-art
approach struggles with due to low training examples. Rather than relying
solely on a specific small training data distribution, our results show that
LLMs provide balanced performance across high- and low-frequency categories.
These results suggest that the LLMs could offer a scalable solution for code
review analytics to improve the effectiveness of the code review process.
Ссылки и действия
Дополнительные ресурсы: