GenAI Voice Mode in Programming Education

2509.10596v1 cs.CY, cs.AI, cs.HC 2025-09-17
Авторы:

Sven Jacobs, Natalie Kiesler

Резюме на русском

Отрывок из журнала 2024 года ## Контекст Реальное временное взаимодействие с искусственным интеллектом (ИИ) через голосовые интерфейсы начинает приобретать важность в области программирования, особенно для начинающих разработчиков. Одной из значимых проблем, с которой сталкиваются начинающие программисты, является недостаток доступности инструментов, предназначенных для поддержки их обучения. Например, программисты с ограниченными физическими возможностями, такими как проблемы с зрением, могут испытывать трудности при использовании стандартных интерфейсов кода. Генетические системы Generative AI (GenAI) могут стать решением для повышения доступности, стимулируя новую модель обучения программированию. Однако, несмотря на значительные достижения в генерировании речевых моделей, лишь мало что известно о том, как начинающие программисты взаимодействуют с такими системами на практике, а также о качестве обратной связи в форме звукового вывода. Эта проблема является одной из мотиваций для данного исследования. ## Метод Для исследования взаимодействия начинающих программистов с генетическим генеративным искусственным интеллектом (GenAI) был разработан возможность использовать голосовой интерфейс в обучении Python. Исследование проводилось в аутентичной учебной среде с участием девяти учеников 9 класса. Для получения данных были зафиксированы голосовые запросы учащихся и ответы системы (1210 сообщений), которые были анализированы с помощью квалитативного кодирования. Было также проведено исследование восприятия учащихся взаимодействия с GenAI с помощью опросника Partner Modeling Questionnaire. Это позволило собрать данные как из технической, так и из психологической точки зрения. ## Результаты Генетический генеративный искусственный интеллект (GenAI) предоставлял обратную связь в виде частичного кода, ответы на вопросы и советы по дальнейшим действиям. Однако, несмотря на важность такой функциональности, система демонстрировала только среднее качество работы. Точность ответов составила 71.4% из 416 образцов анализируемых ответов. Особенно сильной проблемой было понимание и вывод кода, где зачастую ответы были неточными. Учащиеся использовали GenAI в основном для поиска и устранения ошибок в коде. Восприятие системы учащимися было, в основном, положительным — система считалась компетентной и гибкой, но не очень удобной для полноценного общения. ## Значимость Полученные результаты могут быть использованы для улучшения дизайна голосовых интерфейсов в обучении программированию. Это может стать основой для разработки инструментов

Abstract

Real-time voice interfaces using multimodal Generative AI (GenAI) can potentially address the accessibility needs of novice programmers with disabilities (e.g., related to vision). Yet, little is known about how novices interact with GenAI tools and their feedback quality in the form of audio output. This paper analyzes audio dialogues from nine 9th-grade students using a voice-enabled tutor (powered by OpenAI's Realtime API) in an authentic classroom setting while learning Python. We examined the students' voice prompts and AI's responses (1210 messages) by using qualitative coding. We also gathered students' perceptions via the Partner Modeling Questionnaire. The GenAI Voice Tutor primarily offered feedback on mistakes and next steps, but its correctness was limited (71.4% correct out of 416 feedback outputs). Quality issues were observed, particularly when the AI attempted to utter programming code elements. Students used the GenAI voice tutor primarily for debugging. They perceived it as competent, only somewhat human-like, and flexible. The present study is the first to explore the interaction dynamics of real-time voice GenAI tutors and novice programmers, informing future educational tool design and potentially addressing accessibility needs of diverse learners.

Ссылки и действия