Towards Ontology-Based Descriptions of Conversations with Qualitatively-Defined Concepts

2509.04926v1 cs.AI, cs.CL, cs.LG 2025-09-09
Авторы:

Barbara Gendron, Gaël Guibon, Mathieu D'aquin

Резюме на русском

## Контекст Построение контролируемых конверсаций с помощью Бо LLM (Large Language Models) является важной проблемой в области развития интеллектуальных систем. Особенно актуальной является задача контроля уровня профициентности в обучающихся моделях, чтобы обеспечить предсказуемые и пользовательски персонализированные ответы. Несмотря на прогресс в области контролируемого генерирования текста, существуют ключевые проблемы в обеспечении точности, согласованности и удовлетворения потребностей пользователей. Одним из основных рисков является невозможность формальной определенности концепций, относящихся к качественным аспектам коммуникации, таких как профициентность. Данная работа ориентируется на развитие архитектуры, позволяющей выразить такие концепции в четко определенной форме, чтобы включить их в процесс рассуждения и системы контроля. ## Метод Предложенный подход включает в себя разработку онтологии, основанной на формальных определениях квалитиативных понятий, часто применяемых в контексте конверсации. Методология основывается на использовании лингвистических дескрипторов для преобразования качественных определений в количественные, обеспечивая их интеграцию в онтологию для выполнения логических рассуждений и проверки консистентности. Для реализации этого фреймворка применялись методы описательной логики, а также техники генерирования текста с помощью Бо LLM, подвергнутого перенусу для контроля уровня профициентности. ## Результаты Основным результатом является создание системы, позволяющей формально определить профициентность на базе лингвистических дескрипторов. Эти определения были включены в онтологию, которая использовалась для настройки модели Бо LLM. Эксперименты проводились с использованием данных, соответствующих уровням профициентности CEFR (Common European Framework of Reference for Languages). Результаты показали, что полученная модель обеспечивает консистентные и обоснованные определения уровней профициентности, что улучшает транспарентность и управляемость процесса генерирования текста в контексте конверсации. ## Значимость Предложенная модель может быть применена в различных сферах, где необходимо контролировать содержание и качество коммуникаций, в том числе в образовательных системах, системах поддержки клиентов и мобильных приложениях. Одним из преимуществ является улучшение транспарентности и стабильности взаимодействия с Бо LLM, что может повысить доверие пользователей к интеллектуальным системам. Более того, данная работа открывает новые перспективы для развития контролируемого текстового генерирования, основываясь

Abstract

The controllability of Large Language Models (LLMs) when used as conversational agents is a key challenge, particularly to ensure predictable and user-personalized responses. This work proposes an ontology-based approach to formally define conversational features that are typically qualitative in nature. By leveraging a set of linguistic descriptors, we derive quantitative definitions for qualitatively-defined concepts, enabling their integration into an ontology for reasoning and consistency checking. We apply this framework to the task of proficiency-level control in conversations, using CEFR language proficiency levels as a case study. These definitions are then formalized in description logic and incorporated into an ontology, which guides controlled text generation of an LLM through fine-tuning. Experimental results demonstrate that our approach provides consistent and explainable proficiency-level definitions, improving transparency in conversational AI.

Ссылки и действия