Towards Transparent AI Grading: Semantic Entropy as a Signal for Human-AI Disagreement
2508.04105v1
cs.AI
2025-08-09
Авторы:
Karrtik Iyer, Manikandan Ravikiran, Prasanna Pendse, Shayan Mohanty
Резюме на русском
Авторы предлагают решение проблемы несогласия между автоматическими системами оценки и человеческими оценщиками. Они представляют метрику semantic entropy, основанную на разнообразии GPT-4-generated explanations для одного и того же ответа студента. Эта метрика служит proxy для оценки несогласия размышлений между AI и человеком. Авторы рассматривают два вопроса: сходство semantic entropy с несогласием человеческих оценщиков и генерализуемость этой метрики по разным предметным областям. Выводы: semantic entropy может служить interpretable uncertainty signal, улучшая transparency и trustworthiness AI-powered grading. Изучение на ASAP-SAS дало подтверждение того, что этот показатель может значимо варьироваться в зависимости от степени сложности и требований к интерпретации решений.
Abstract
Automated grading systems can efficiently score short-answer responses, yet
they often fail to indicate when a grading decision is uncertain or potentially
contentious. We introduce semantic entropy, a measure of variability across
multiple GPT-4-generated explanations for the same student response, as a proxy
for human grader disagreement. By clustering rationales via entailment-based
similarity and computing entropy over these clusters, we quantify the diversity
of justifications without relying on final output scores. We address three
research questions: (1) Does semantic entropy align with human grader
disagreement? (2) Does it generalize across academic subjects? (3) Is it
sensitive to structural task features such as source dependency? Experiments on
the ASAP-SAS dataset show that semantic entropy correlates with rater
disagreement, varies meaningfully across subjects, and increases in tasks
requiring interpretive reasoning. Our findings position semantic entropy as an
interpretable uncertainty signal that supports more transparent and trustworthy
AI-assisted grading workflows.
Ссылки и действия
Дополнительные ресурсы: