RAG-PRISM: A Personalized, Rapid, and Immersive Skill Mastery Framework with Adaptive Retrieval-Augmented Tutoring
2509.00646v1
cs.CY, cs.AI
2025-09-05
Авторы:
Gaurangi Raul, Yu-Zheng Lin, Karan Patel, Bono Po-Jen Shih, Matthew W. Redondo, Banafsheh Saber Latibari, Jesus Pacheco, Soheil Salehi, Pratik Satam
Резюме на русском
## Контекст
В последние годы системы Fourth Industrial Revolution (4IR) внедряются во все большей степени в различные сферы жизнедеятельности, включая промышленность, здравоохранение, образование и даже жизнь каждого человека. Этот процесс способствует значительному расширению возможностей людей, но при этом приводит к росту спроса на новые компетенции и навыки. Однако существует значительная проблема — старые работники часто имеют трудности с погружением в новые технологии, что приводит к росту "skills gap" (разрыва в навыках). Этот разрыв широко известен в области STEM (science, technology, engineering, mathematics), где востребованы навыки в сферах robotics, automation, artificial intelligence и cybersecurity.
Образовательные программы, нацеленные на повышение навыков, должны учитывать разнообразие фона, стилей обучения и мотивации учащихся. Оптимальные решения должны обеспечить эффективность и быструю настройку на индивидуальные потребности определенного обучающегося, а также предоставлять качественный и быстрый образовательный процесс с минимальными затратами. Наша цель — разработать адаптивный фреймворк обучения, который использует Retrieval-Augmented Generation (RAG) и Generative AI для персонализированного и эффективного обучения.
## Метод
Мы предлагаем RAG-PRISM, фреймворк, который объединяет Retrieval-Augmented Generation (RAG) с Generative AI для обеспечения адаптивного обучения. Основной элемент этого фреймворка — оптимизация содержимого для каждого учащегося на основе двух ключевых показателей: document hit rate и Mean Reciprocal Rank (MRR). Эти показатели позволяют гибко настроить квалификационные требования для каждого обучающегося, учитывая их уровень подготовки и специфические интересы.
Для повышения качества обучения используется синтетическая датасет, повторяющий работу обучающихся. Мы также использовали LLM (Large Language Models), такие как GPT-3.5 и GPT-4, для генерации ответов, которые последуют за тем, что требуется от учащихся. Для оценки качества мы сравниваем генерируемое RAG-PRISM со стандартными ручными запросами, включая вопросы, стандартно поступающие от обучающихся, и оцениваем их значимость и актуальность.
## Результаты
Мы проводили эксперименты с двумя типами данных: 1) синтетическим датасетом, настроенным на имитацию работы обучающихся, и 2) ручным запросом, учитывающим реальные сценарии обучения. Мы оценивали добавленные в RAG-PRISM модели GPT-3.5 и GPT-4 для их удовлетворенности и наличия актуальных ответов.
Результаты показали, что модель GPT-4 достигла 87% релевантности и 100% соответствия целям, что делает ее наиболее эффективной для обучения в сфере 4IR cybersecurity. Эта модель также доказала свою гибкость в создании персонализированного контента, ко
Abstract
The rapid digital transformation of Fourth Industrial Revolution (4IR)
systems is reshaping workforce needs, widening skill gaps, especially for older
workers. With growing emphasis on STEM skills such as robotics, automation,
artificial intelligence (AI), and security, large-scale re-skilling and
up-skilling are required. Training programs must address diverse backgrounds,
learning styles, and motivations to improve persistence and success, while
ensuring rapid, cost-effective workforce development through experiential
learning. To meet these challenges, we present an adaptive tutoring framework
that combines generative AI with Retrieval-Augmented Generation (RAG) to
deliver personalized training. The framework leverages document hit rate and
Mean Reciprocal Rank (MRR) to optimize content for each learner, and is
benchmarked against human-generated training for alignment and relevance. We
demonstrate the framework in 4IR cybersecurity learning by creating a synthetic
QA dataset emulating trainee behavior, while RAG is tuned on curated
cybersecurity materials. Evaluation compares its generated training with
manually curated queries representing realistic student interactions. Responses
are produced using large language models (LLMs) including GPT-3.5 and GPT-4,
assessed for faithfulness and content alignment. GPT-4 achieves the best
performance with 87% relevancy and 100% alignment. Results show this dual-mode
approach enables the adaptive tutor to act as both a personalized topic
recommender and content generator, offering a scalable solution for rapid,
tailored learning in 4IR education and workforce development.
Ссылки и действия
Дополнительные ресурсы: