Towards Transparent AI Grading: Semantic Entropy as a Signal for Human-AI Disagreement

2508.04105v1 cs.AI 2025-08-09
Авторы:

Karrtik Iyer, Manikandan Ravikiran, Prasanna Pendse, Shayan Mohanty

Резюме на русском

Авторы предлагают решение проблемы несогласия между автоматическими системами оценки и человеческими оценщиками. Они представляют метрику semantic entropy, основанную на разнообразии GPT-4-generated explanations для одного и того же ответа студента. Эта метрика служит proxy для оценки несогласия размышлений между AI и человеком. Авторы рассматривают два вопроса: сходство semantic entropy с несогласием человеческих оценщиков и генерализуемость этой метрики по разным предметным областям. Выводы: semantic entropy может служить interpretable uncertainty signal, улучшая transparency и trustworthiness AI-powered grading. Изучение на ASAP-SAS дало подтверждение того, что этот показатель может значимо варьироваться в зависимости от степени сложности и требований к интерпретации решений.

Abstract

Automated grading systems can efficiently score short-answer responses, yet they often fail to indicate when a grading decision is uncertain or potentially contentious. We introduce semantic entropy, a measure of variability across multiple GPT-4-generated explanations for the same student response, as a proxy for human grader disagreement. By clustering rationales via entailment-based similarity and computing entropy over these clusters, we quantify the diversity of justifications without relying on final output scores. We address three research questions: (1) Does semantic entropy align with human grader disagreement? (2) Does it generalize across academic subjects? (3) Is it sensitive to structural task features such as source dependency? Experiments on the ASAP-SAS dataset show that semantic entropy correlates with rater disagreement, varies meaningfully across subjects, and increases in tasks requiring interpretive reasoning. Our findings position semantic entropy as an interpretable uncertainty signal that supports more transparent and trustworthy AI-assisted grading workflows.

Ссылки и действия