Understanding Prompt Management in GitHub Repositories: A Call for Best Practices

2509.12421v1 cs.SE, cs.AI 2025-09-18

Авторы:

Hao Li, Hicham Masri, Filipe R. Cogo, Abdul Ali Bangash, Bram Adams, Ahmed E. Hassan

Резюме на русском

## Контекст Продвинутая разработка систем на основе технологий ИИ, таких как foundation models (например, большие языковые модели), привела к возникновению "promptware" — программного обеспечения, основанного на естественном языке. Одним из ключевых аспектов работы с таким программным обеспечением является эффективное управление приглашениями (prompts). Однако при этом возникают значительные проблемы: проблемы в форматировании, дублирование приглашений и возникновение читаемости. Эти проблемы вызывают трудности в обслуживании и оптимизации приложений. В данном исследовании проводится анализ 24 800 открытых приглашений из 92 репозиториев GitHub, чтобы определить практики управления приглашениями и определить критические характеристики качества. Наши результаты показывают важность решения этих проблем для повышения эффективности разработки и использования программного обеспечения в условиях быстро меняющейся среды promptware. ## Метод Для исследования использовалось автоматическое сборище и анализ данных открытых приглашений с GitHub. Мы разработали специальные алгоритмы для автоматического распознавания и классификации приглашений, а также для идентификации проблем с их форматированием, читаемостью и дублированием. Методология включает в себя автоматическую сборку данных, анализ текста, оценку качества и форматирования приглашений, а также поиск идентичных или похожих приглашений внутри и между репозиториями. Данные ускоренного сборки и анализа позволяют выявить ключевые проблемы, связанные с управлением приглашениями в системах на основе ИИ. ## Результаты В ходе исследования были выявлены критические проблемы с приглашениями, в том числе существенное дублирование, ухудшение читаемости, несогласованность форматирования и проблемы с орфографией. Например, более 40% приглашений имели одинаковую структуру, что приводит к неэффективности и необходимости повторной работы. Также было выявлено, что около 20% приглашений имели проблемы с читаемостью, что может ограничить их эффективность в работе. Эти результаты подтверждают важность разработки лучших практик управления приглашениями в системах promptware, чтобы оптимизировать процессы разработки и сократить частоту ошибок. ## Значимость Найденные результаты имеют важное значение для развития программного обеспечения в области AI, где приглашения (prompts) являются ключевым инструментом для взаимодействия с моделями ИИ. Эффективное управление приглашениями может повысить качество и удобство использования программного обеспечения, уменьшить время разработки и помочь воспроизводимости результатов. Полученные рекоменда

Abstract

The rapid adoption of foundation models (e.g., large language models) has given rise to promptware, i.e., software built using natural language prompts. Effective management of prompts, such as organization and quality assurance, is essential yet challenging. In this study, we perform an empirical analysis of 24,800 open-source prompts from 92 GitHub repositories to investigate prompt management practices and quality attributes. Our findings reveal critical challenges such as considerable inconsistencies in prompt formatting, substantial internal and external prompt duplication, and frequent readability and spelling issues. Based on these findings, we provide actionable recommendations for developers to enhance the usability and maintainability of open-source prompts within the rapidly evolving promptware ecosystem.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Understanding Prompt Management in GitHub Repositories: A Call for Best Practices

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Automating Complex Document Workflows via Stepwise and Rollback-Enabled Operatio...

Quantitative Analysis of Technical Debt and Pattern Violation in Large Language ...

MANTRA: a Framework for Multi-stage Adaptive Noise TReAtment During Training

Beyond Greenfield: The D3 Framework for AI-Driven Productivity in Brownfield Eng...

LLM-as-a-Judge for Scalable Test Coverage Evaluation: Accuracy, Operational Reli...

Навигация