Exploring the Challenges and Opportunities of AI-assisted Codebase Generation

2508.07966v1 cs.SE, cs.AI 2025-08-13
Авторы:

Philipp Eibl, Sadra Sabouri, Souti Chattopadhyay

Резюме на русском

## Контекст Современные AI-помощники по кодированию (CBAs) показали себя как мощные инструменты, улучшающие процесс структурирования и генерирования программного кода. Они предлагают возможность генерировать и адаптировать всю структуру программы на основе текстового описания, превосходя при этом многие предыдущие подходы, ограниченные генерированием участков кода (snippet-level). Несмотря на перспективу, CBAs еще не получили такую популярность, как более простые сниппет-генераторы. Ранее изучалось генерирование кода на уровне сниппетов, но CBAs, охватывающие более широкий спектр задач, требуют подробного изучения. Эта работа нацелена на выявление проблем, с которыми сталкиваются разработчики при использовании CBAs, а также на выявление возможностей для оптимизации этих систем. ## Метод Для изучения проблем при работе с CBAs была проведена пользовательская исследовательская исследовательская сессия (user study), в которой участвовали 16 разработчики и студенты. Участники выполняли задачи по кодированию, используя различные CBAs. На каждом этапе исследования было собрано подробное журнал событий, описывающие взаимодействия участников с системами. Были проведены интервью для получения более детальных отзывов и анализа опыта взаимодействия. Затем проведено сравнение 21 коммерческих CBAs с выявленными проблемами и необходимостями. ## Результаты Участники различались в стратегиях подачи информации во вводных запросах (prompts). Более четверти запросов содержали описания проблем, почти все — требования функциональности, а 48% — структурные запросы. Однако полученные результаты не удовлетворили участников. Низкая оценка качества кода (mean = 2.8, median = 3) была самой распространенной причиной недовольства, за которой следовали проблемы с коммуникацией и неполноте функциональности. Основные барьеры включали неполное понимание требований, проблемы с настройкой программ, и несовпадение ожиданий. Также выявлены шесть основных проблем, с которыми сталкиваются разработчики при использовании CBAs. ## Значимость Результаты имеют решающее значение для развития AI-помощников по кодированию. Изучение проблем и недочетов при использовании CBAs позволяет раскрыть потенциал этих систем для развития программирования. Оптимизация CBAs способна влиять на скорость разработки, качество кода и удовлетворенность пользователей. Открытые возможности включают развитие более гибких моделей для лучшего взаимодействия с пользователем и более эффективного использования при работе с большими кодовыми базами. ## Выводы Основные достижения: - Раскрыта многообраз

Abstract

Recent AI code assistants have significantly improved their ability to process more complex contexts and generate entire codebases based on a textual description, compared to the popular snippet-level generation. These codebase AI assistants (CBAs) can also extend or adapt codebases, allowing users to focus on higher-level design and deployment decisions. While prior work has extensively studied the impact of snippet-level code generation, this new class of codebase generation models is relatively unexplored. Despite initial anecdotal reports of excitement about these agents, they remain less frequently adopted compared to snippet-level code assistants. To utilize CBAs better, we need to understand how developers interact with CBAs, and how and why CBAs fall short of developers' needs. In this paper, we explored these gaps through a counterbalanced user study and interview with (n = 16) students and developers working on coding tasks with CBAs. We found that participants varied the information in their prompts, like problem description (48% of prompts), required functionality (98% of prompts), code structure (48% of prompts), and their prompt writing process. Despite various strategies, the overall satisfaction score with generated codebases remained low (mean = 2.8, median = 3, on a scale of one to five). Participants mentioned functionality as the most common factor for dissatisfaction (77% of instances), alongside poor code quality (42% of instances) and communication issues (25% of instances). We delve deeper into participants' dissatisfaction to identify six underlying challenges that participants faced when using CBAs, and extracted five barriers to incorporating CBAs into their workflows. Finally, we surveyed 21 commercial CBAs to compare their capabilities with participant challenges and present design opportunities for more efficient and useful CBAs.

Ссылки и действия