Rule-Based Moral Principles for Explaining Uncertainty in Natural Language Generation
2509.07190v1
cs.CL, cs.HC
2025-09-11
Авторы:
Zahra Atf, Peter R Lewis
Резюме на русском
## Контекст
Современные технологии применяются во многих областях, где необходимо обеспечивать доверие и прозрачность. В частности, большие естественным языком настроенные модели (LLMs) пользуются спросом в высокорисковых сферах, таких как медицина и правосудие. Однако объяснение невербальной степени неопределенности в тексте, сгенерированном такими моделями, остается трудной задачей. Наличествующие проблемы связаны с тем, что большинство методов оперируют прогностическими моделями, которые зачастую недостаточно ясны и не соответствуют ожиданиям пользователей в отношении открытости. Данное исследование ориентировано на разработку нового подхода, основывающегося на правилах морального разума, для обработки неопределенности в генерируемых текстах.
## Метод
Методология построена на использовании правил, основанных на моральном разуме, и их интеграции в процесс генерирования текста. В качестве основы выбрана модель виртуозного этического мышления, которая включает в себя такие принципы, как предосторожность, ответственность и делегирование. Эти принципы были кодированы в виде упрощенной системы решений на Prolog, которая способна определять уровень неопределенности и выдавать рациональные обоснования в человеческой речи. Архитектура исследуемой системы основывается на сочетании легковесной модели взаимодействия с прогностическим рассуждением, чтобы обеспечить корректность и понятность результатов.
## Результаты
В ходе экспериментов проводились сценарии симуляций, включающие различные уровни неопределенности в тексте. Были созданы данные сценарии, которые позволили оценить эффективность фреймворка в сферах здравоохранения и правосудия. Результаты показали хорошую степень калибровки доверия пользователей, а также повышение ясности интерпретации результатов. Визуализация результатов демонстрирует, что применение правил морального разума оказалось более эффективным в сравнении с простой моделью на основе вероятностного подхода, особенно в сложных сценариях.
## Значимость
Основное применение данного подхода — в сферах, где необходима высокая интерпретируемость результатов. К примерам можно отнести клинические решения и юридические процессы. Данный подход предоставляет значительные преимущества перед существующими моделями. В частности, он обеспечивает лучшую ясность, понимание и взаимодействие с пользователями. Будущие исследования будут ориентированы на уточнение правил морального разума и их применение в дополнительных областях, таких как образование и социальные сети.
## Выводы
Результаты исследований показали, что моральные прин
Abstract
Large language models (LLMs) are increasingly used in high-stakes settings,
where explaining uncertainty is both technical and ethical. Probabilistic
methods are often opaque and misaligned with expectations of transparency. We
propose a framework based on rule-based moral principles for handling
uncertainty in LLM-generated text. Using insights from moral psychology and
virtue ethics, we define rules such as precaution, deference, and
responsibility to guide responses under epistemic or aleatoric uncertainty.
These rules are encoded in a lightweight Prolog engine, where uncertainty
levels (low, medium, high) trigger aligned system actions with plain-language
rationales. Scenario-based simulations benchmark rule coverage, fairness, and
trust calibration. Use cases in clinical and legal domains illustrate how moral
reasoning can improve trust and interpretability. Our approach offers a
transparent, lightweight alternative to probabilistic models for socially
responsible natural language generation.
Ссылки и действия
Дополнительные ресурсы: