RAG-PRISM: A Personalized, Rapid, and Immersive Skill Mastery Framework with Adaptive Retrieval-Augmented Tutoring

2509.00646v1 cs.CY, cs.AI 2025-09-05
Авторы:

Gaurangi Raul, Yu-Zheng Lin, Karan Patel, Bono Po-Jen Shih, Matthew W. Redondo, Banafsheh Saber Latibari, Jesus Pacheco, Soheil Salehi, Pratik Satam

Резюме на русском

## Контекст В последние годы системы Fourth Industrial Revolution (4IR) внедряются во все большей степени в различные сферы жизнедеятельности, включая промышленность, здравоохранение, образование и даже жизнь каждого человека. Этот процесс способствует значительному расширению возможностей людей, но при этом приводит к росту спроса на новые компетенции и навыки. Однако существует значительная проблема — старые работники часто имеют трудности с погружением в новые технологии, что приводит к росту "skills gap" (разрыва в навыках). Этот разрыв широко известен в области STEM (science, technology, engineering, mathematics), где востребованы навыки в сферах robotics, automation, artificial intelligence и cybersecurity. Образовательные программы, нацеленные на повышение навыков, должны учитывать разнообразие фона, стилей обучения и мотивации учащихся. Оптимальные решения должны обеспечить эффективность и быструю настройку на индивидуальные потребности определенного обучающегося, а также предоставлять качественный и быстрый образовательный процесс с минимальными затратами. Наша цель — разработать адаптивный фреймворк обучения, который использует Retrieval-Augmented Generation (RAG) и Generative AI для персонализированного и эффективного обучения. ## Метод Мы предлагаем RAG-PRISM, фреймворк, который объединяет Retrieval-Augmented Generation (RAG) с Generative AI для обеспечения адаптивного обучения. Основной элемент этого фреймворка — оптимизация содержимого для каждого учащегося на основе двух ключевых показателей: document hit rate и Mean Reciprocal Rank (MRR). Эти показатели позволяют гибко настроить квалификационные требования для каждого обучающегося, учитывая их уровень подготовки и специфические интересы. Для повышения качества обучения используется синтетическая датасет, повторяющий работу обучающихся. Мы также использовали LLM (Large Language Models), такие как GPT-3.5 и GPT-4, для генерации ответов, которые последуют за тем, что требуется от учащихся. Для оценки качества мы сравниваем генерируемое RAG-PRISM со стандартными ручными запросами, включая вопросы, стандартно поступающие от обучающихся, и оцениваем их значимость и актуальность. ## Результаты Мы проводили эксперименты с двумя типами данных: 1) синтетическим датасетом, настроенным на имитацию работы обучающихся, и 2) ручным запросом, учитывающим реальные сценарии обучения. Мы оценивали добавленные в RAG-PRISM модели GPT-3.5 и GPT-4 для их удовлетворенности и наличия актуальных ответов. Результаты показали, что модель GPT-4 достигла 87% релевантности и 100% соответствия целям, что делает ее наиболее эффективной для обучения в сфере 4IR cybersecurity. Эта модель также доказала свою гибкость в создании персонализированного контента, ко

Abstract

The rapid digital transformation of Fourth Industrial Revolution (4IR) systems is reshaping workforce needs, widening skill gaps, especially for older workers. With growing emphasis on STEM skills such as robotics, automation, artificial intelligence (AI), and security, large-scale re-skilling and up-skilling are required. Training programs must address diverse backgrounds, learning styles, and motivations to improve persistence and success, while ensuring rapid, cost-effective workforce development through experiential learning. To meet these challenges, we present an adaptive tutoring framework that combines generative AI with Retrieval-Augmented Generation (RAG) to deliver personalized training. The framework leverages document hit rate and Mean Reciprocal Rank (MRR) to optimize content for each learner, and is benchmarked against human-generated training for alignment and relevance. We demonstrate the framework in 4IR cybersecurity learning by creating a synthetic QA dataset emulating trainee behavior, while RAG is tuned on curated cybersecurity materials. Evaluation compares its generated training with manually curated queries representing realistic student interactions. Responses are produced using large language models (LLMs) including GPT-3.5 and GPT-4, assessed for faithfulness and content alignment. GPT-4 achieves the best performance with 87% relevancy and 100% alignment. Results show this dual-mode approach enables the adaptive tutor to act as both a personalized topic recommender and content generator, offering a scalable solution for rapid, tailored learning in 4IR education and workforce development.

Ссылки и действия