Rule-Based Moral Principles for Explaining Uncertainty in Natural Language Generation

2509.07190v1 cs.CL, cs.HC 2025-09-11

Авторы:

Zahra Atf, Peter R Lewis

Резюме на русском

## Контекст Современные технологии применяются во многих областях, где необходимо обеспечивать доверие и прозрачность. В частности, большие естественным языком настроенные модели (LLMs) пользуются спросом в высокорисковых сферах, таких как медицина и правосудие. Однако объяснение невербальной степени неопределенности в тексте, сгенерированном такими моделями, остается трудной задачей. Наличествующие проблемы связаны с тем, что большинство методов оперируют прогностическими моделями, которые зачастую недостаточно ясны и не соответствуют ожиданиям пользователей в отношении открытости. Данное исследование ориентировано на разработку нового подхода, основывающегося на правилах морального разума, для обработки неопределенности в генерируемых текстах. ## Метод Методология построена на использовании правил, основанных на моральном разуме, и их интеграции в процесс генерирования текста. В качестве основы выбрана модель виртуозного этического мышления, которая включает в себя такие принципы, как предосторожность, ответственность и делегирование. Эти принципы были кодированы в виде упрощенной системы решений на Prolog, которая способна определять уровень неопределенности и выдавать рациональные обоснования в человеческой речи. Архитектура исследуемой системы основывается на сочетании легковесной модели взаимодействия с прогностическим рассуждением, чтобы обеспечить корректность и понятность результатов. ## Результаты В ходе экспериментов проводились сценарии симуляций, включающие различные уровни неопределенности в тексте. Были созданы данные сценарии, которые позволили оценить эффективность фреймворка в сферах здравоохранения и правосудия. Результаты показали хорошую степень калибровки доверия пользователей, а также повышение ясности интерпретации результатов. Визуализация результатов демонстрирует, что применение правил морального разума оказалось более эффективным в сравнении с простой моделью на основе вероятностного подхода, особенно в сложных сценариях. ## Значимость Основное применение данного подхода — в сферах, где необходима высокая интерпретируемость результатов. К примерам можно отнести клинические решения и юридические процессы. Данный подход предоставляет значительные преимущества перед существующими моделями. В частности, он обеспечивает лучшую ясность, понимание и взаимодействие с пользователями. Будущие исследования будут ориентированы на уточнение правил морального разума и их применение в дополнительных областях, таких как образование и социальные сети. ## Выводы Результаты исследований показали, что моральные прин

Abstract

Large language models (LLMs) are increasingly used in high-stakes settings, where explaining uncertainty is both technical and ethical. Probabilistic methods are often opaque and misaligned with expectations of transparency. We propose a framework based on rule-based moral principles for handling uncertainty in LLM-generated text. Using insights from moral psychology and virtue ethics, we define rules such as precaution, deference, and responsibility to guide responses under epistemic or aleatoric uncertainty. These rules are encoded in a lightweight Prolog engine, where uncertainty levels (low, medium, high) trigger aligned system actions with plain-language rationales. Scenario-based simulations benchmark rule coverage, fairness, and trust calibration. Use cases in clinical and legal domains illustrate how moral reasoning can improve trust and interpretability. Our approach offers a transparent, lightweight alternative to probabilistic models for socially responsible natural language generation.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Rule-Based Moral Principles for Explaining Uncertainty in Natural Language Generation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Is Lying Only Sinful in Islam? Exploring Religious Bias in Multilingual Large La...

ELR-1000: A Community-Generated Dataset for Endangered Indic Indigenous Language...

TaleFrame: An Interactive Story Generation System with Fine-Grained Control and ...

Critical or Compliant? The Double-Edged Sword of Reasoning in Chain-of-Thought E...

Critical or Compliant? The Double-Edged Sword of Reasoning in Chain-of-Thought E...

Навигация