Few-Shot Prompting for Extractive Quranic QA with Instruction-Tuned LLMs

2508.06103v1 cs.CL, cs.IR 2025-08-12

Авторы:

Mohamed Basem, Islam Oshallah, Ali Hamdi, Ammar Mohammed

Резюме на русском

## Контекст Исследование посвящено развитию методов Extractive Question Answering (QA) на текстах Корана. Это задача является важной в свете уникальности языка Корана, который отличается сложной структурой, уникальным лексиконом и глубоким смысловым слоем. Несмотря на развитие технологий машинного обучения, эта область сталкивается с рядом проблем, включая недостаточную репрезентативность данных, сложность разбора специфического языка и необходимость точного понимания текста. Эти аспекты приводят к вызовам для создания эффективных моделей QA, которые могли бы обеспечить релевантные и точные ответы. Целью работы является разработка инновационных подходов, которые улучшат точность и качество ответов в условиях незначительного объема данных для обучения. ## Метод Работа предлагает два основных подхода к решению задачи Extractive QA на Коране. Первый подход основан на использовании предобученных моделей с инструкционным настройкой (instruction-tuning), включая модели Gemini и DeepSeek. Для решения задачи разработана специализированная программа для формирования арабских запросов в формате малого обучения (few-shot prompting). Для повышения точности ответов используется продвинутая система пост-обработки, включающая: - **Поддержание субструктурной алернтивативности** (subword alignment) для точного выделения ответов. - **Запрет перекрытия** (overlap suppression), чтобы избежать неточностей при выделении ответов. - **Семантическое фильтрование** (semantic filtering), чтобы удалить несоответствующие ответы. Эти методы позволяют улучшить качество ответов, уменьшив риск генерирования неточных или ложных сведений (hallucinations). ## Результаты Исследования проводятся на корпусе Корана, где применяются варианты описанных подходов. Оценка производится с помощью метрики pAP10 (Precision at 10), которая измеряет точность ответов в 10 вариантах. Наилучший результат демонстрирует модель с малоинвазивным настройкой (few-shot prompting) и пост-обработкой, достигающую pAP10 равного 0.637. Это значительно превосходит результаты моделей, обученных с помощью традиционных методов fine-tuning. Эксперименты показывают, что инструкционное настройко-обучение (instruction-tuning) с использованием арабских запросов эффективно для решения сложных задач QA на небольших объемах данных. ## Значимость Результаты имеют перспективу для применения в сферах, требующих понимания сложных текстов на малоизвестных языках. Из них могут получить выгоду разработчики моделей QA для риторических и социальных текстов, а также исследователи, работающие с неофициальными языками. Помимо того, этот подход демонстрирует выгоду использования небольших обучающих наборов для эффективного решения задач в усло

Abstract

This paper presents two effective approaches for Extractive Question Answering (QA) on the Quran. It addresses challenges related to complex language, unique terminology, and deep meaning in the text. The second uses few-shot prompting with instruction-tuned large language models such as Gemini and DeepSeek. A specialized Arabic prompt framework is developed for span extraction. A strong post-processing system integrates subword alignment, overlap suppression, and semantic filtering. This improves precision and reduces hallucinations. Evaluations show that large language models with Arabic instructions outperform traditional fine-tuned models. The best configuration achieves a pAP10 score of 0.637. The results confirm that prompt-based instruction tuning is effective for low-resource, semantically rich QA tasks.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Few-Shot Prompting for Extractive Quranic QA with Instruction-Tuned LLMs

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

AR-Med: Automated Relevance Enhancement in Medical Search via LLM-Driven Informa...

Mitigating the Threshold Priming Effect in Large Language Model-Based Relevance ...

MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications

Towards Unification of Hallucination Detection and Fact Verification for Large L...

Навигация