Exploring the Potential of Large Language Models in Fine-Grained Review Comment Classification

2508.09832v1 cs.SE, cs.AI 2025-08-15

Авторы:

Linh Nguyen, Chunhua Liu, Hong Yi Lin, Patanamon Thongtanunam

Резюме на русском

## Контекст Code review является ключевым элементом в процессе разработки программного обеспечения. Он позволяет идентифицировать проблемы в коде, обеспечивать качество и совместимость. Однако в ходе легковесных кодовых рецензий могут возникнуть проблемы, которые трудно автоматически идентифицировать с помощью существующих методов. Обычно для повышения эффективности кодовых рецензий используются методы автоматизации, основанные на машинном обучении. Однако существующие подходы, основанные на супервизированном машинном обучении, требуют больших объемов методически обработанных данных для эффективного обучения моделей. Данная статья исследует возможности использования бо LLM (больших языковых моделей) для классификации кодовых рецензий на 17 классов, чтобы улучшить качество анализа и автоматизации процесса кода. ## Метод Мы использовали 17 кategorii кодовых рецензий, полученных из кодовых баз данных, для тренировки и тестирования бо LLM. Для обучения мы использовали большое объемом текстового кода и текстовые примеры кодовых рецензий. Мы разработали архитектуру модели, основываясь на Transformer, для повышения точности классификации. Мы провели эксперименты с различными вариантами параметров модели и затем сравнили результаты с текущим лучшим подходом. ## Результаты Мы провели эксперименты с различными вариантами параметров модели и сравнили результаты с текущим лучшим подходом. Бо LLM показал высокую точность в классификации, повышая эффективность кода в 17 категориях. Особенно выдающиеся результаты были достигнуты в 5 самых важных классах, где традиционные методы сталкивались с проблемами из-за ограниченного объема обучающих данных. Бо LLM обеспечил более балансированную точность в классификации как высокочастотных, так и низкочастотных категорий. ## Значимость Данный подход имеет значительное значение в развитии технологий кодовых рецензий. Он может быть применен в разных областях, таких как улучшение анализа кодового качества, автоматизация кодовых процессов и повышение производительности разработчиков. Выявленные преимущества LLMs включают более точную классификацию, более широкий спектр применения и высокую совместимость с разными типами данных. Эти результаты могут привести к улучшению кодовых рецензий и повышению качества программного обеспечения. ## Выводы Мы доказали, что бо LLM могут представлять собой эффективное решение для классификации кодовых рецензий. Они обеспечивают более балансированную точность классификации, что делает их применимыми для различных типов кодовых рецензий. В будущем мы планируем расшири

Abstract

Code review is a crucial practice in software development. As code review nowadays is lightweight, various issues can be identified, and sometimes, they can be trivial. Research has investigated automated approaches to classify review comments to gauge the effectiveness of code reviews. However, previous studies have primarily relied on supervised machine learning, which requires extensive manual annotation to train the models effectively. To address this limitation, we explore the potential of using Large Language Models (LLMs) to classify code review comments. We assess the performance of LLMs to classify 17 categories of code review comments. Our results show that LLMs can classify code review comments, outperforming the state-of-the-art approach using a trained deep learning model. In particular, LLMs achieve better accuracy in classifying the five most useful categories, which the state-of-the-art approach struggles with due to low training examples. Rather than relying solely on a specific small training data distribution, our results show that LLMs provide balanced performance across high- and low-frequency categories. These results suggest that the LLMs could offer a scalable solution for code review analytics to improve the effectiveness of the code review process.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Exploring the Potential of Large Language Models in Fine-Grained Review Comment Classification

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Automating Complex Document Workflows via Stepwise and Rollback-Enabled Operatio...

Quantitative Analysis of Technical Debt and Pattern Violation in Large Language ...

MANTRA: a Framework for Multi-stage Adaptive Noise TReAtment During Training

Beyond Greenfield: The D3 Framework for AI-Driven Productivity in Brownfield Eng...

LLM-as-a-Judge for Scalable Test Coverage Evaluation: Accuracy, Operational Reli...

Навигация