SimInterview: Transforming Business Education through Large Language Model-Based Simulated Multilingual Interview Training System
2508.11873v1
cs.CY, cs.AI, cs.HC, cs.MM
2025-08-19
Авторы:
Truong Thanh Hung Nguyen, Tran Diem Quynh Nguyen, Hoang Loc Cao, Thi Cam Thanh Tran, Thi Cam Mai Truong, Hung Cao
Резюме на русском
## Контекст
Успех в современном бизнесе часто зависит от способности представителей компаний вести эффективные интервью. Однако классические методы обучения в этой области часто являются стандартизированными и не учитывают индивидуальные особенности кандидатов, а также культурные и языковые различия. Это приводит к проблемам в подготовке бизнес-профессионалов, особенно в условиях международных рынков. Недостаток индивидуального подхода приводит к неэффективности подготовки и несоответствию требованиям рынка. Таким образом, возникает необходимость в разработке систем, которые могут предоставить индивидуальную, культурно осознанную и практически читаемую подготовку к бизнес-интервью, учитывая различия в языках и культурах.
## Метод
SimInterview представляет собой LLM-based simulated multilingual interview training system, основанный на трёх основных компонентах:
1. **Large Language Model Agent (LLM-agent)**: Он управляет всеми интерактивными задачами, в том числе вопросами, ответами, синтезом речи и разговорным моделированием.
2. **Synthetic AI Technologies**: Используются для моделирования реалистичных виртуальных рекрутеров.
3. **Retrieval-Augmented Generation (RAG)**: Этот подход адаптирует сценарии интервью к конкретным резюме кандидатов и требованиям к позиции.
Система использует модели LLMs, такие как OpenAI o3, Llama 4 Maverick и Gemma 3, для обработки текста и генерации говорящих агентов. Она также интегрирует Whisper для распознавания речи, GPT-SoVITS для синтеза речи и Ditto для генерирования говорящих голов. Данные хранятся в ChromaDB в виде векторных баз данных.
## Результаты
В ходе экспериментов с участием университетских кандидатов SimInterview показал высокую точность в оценке интервью и высокую удовлетворенность пользователей. Он выдал точные результаты в многоязычной среде (английский и японский), где пользователи особенно ценили то, как система сохраняла индивидуальность кандидатов и учёла культурные различия. Например, японский формат резюме был лучше захвачен со всеми важными деталями, тогда как разнообразие английских резюме привносило более высокий уровень сложности и вариативности в процессе.
## Значимость
SimInterview может применяться в области обучения мягким навыкам, глобализации бизнеса и работе с многократной культурой. Он предоставляет выгоды в виде точной индивидуальной подготовки, гибкости в работе с разными культурами и языками, а также высокой точности во взаимодействии. Это может стать ключевым инструментом для успешной карьерной подготовки в международных компаниях.
## Выводы
Разработанная система продемонстрировала успех в
Abstract
Business interview preparation demands both solid theoretical grounding and
refined soft skills, yet conventional classroom methods rarely deliver the
individualized, culturally aware practice employers currently expect. This
paper introduces SimInterview, a large language model (LLM)-based simulated
multilingual interview training system designed for business professionals
entering the AI-transformed labor market. Our system leverages an LLM agent and
synthetic AI technologies to create realistic virtual recruiters capable of
conducting personalized, real-time conversational interviews. The framework
dynamically adapts interview scenarios using retrieval-augmented generation
(RAG) to match individual resumes with specific job requirements across
multiple languages. Built on LLMs (OpenAI o3, Llama 4 Maverick, Gemma 3),
integrated with Whisper speech recognition, GPT-SoVITS voice synthesis, Ditto
diffusion-based talking head generation model, and ChromaDB vector databases,
our system significantly improves interview readiness across English and
Japanese markets. Experiments with university-level candidates show that the
system consistently aligns its assessments with job requirements, faithfully
preserves resume content, and earns high satisfaction ratings, with the
lightweight Gemma 3 model producing the most engaging conversations.
Qualitative findings revealed that the standardized Japanese resume format
improved document retrieval while diverse English resumes introduced additional
variability, and they highlighted how cultural norms shape follow-up
questioning strategies. Finally, we also outlined a contestable AI design that
can explain, detect bias, and preserve human-in-the-loop to meet emerging
regulatory expectations.