Selective Risk Certification for LLM Outputs via Information-Lift Statistics: PAC-Bayes, Robustness, and Skeleton Design
2509.12527v1
cs.LG, stat.ML
2025-09-18
Авторы:
Sanjeda Akter, Ibne Farabi Shihab, Anuj Sharma
Резюме на русском
## Контекст
Large language models (LLMs) пользуются всесторонним применением в различных сферах жизнедеятельности. Однако они часто выдают довольно верные, но неверные ответы, что является неприемлемым для многих задач, требующих высокой точности. Это проблема становится острой в сферах, таких как здравоохранение, юриспруденция и финансы, где неверные ответы могут иметь серьезные последствия. Недостатком существующих подходов, таких как HallBayes, является отсутствие формальных гарантий их работы. Мы предлагаем новую теорию, основанную на **информационном скелете**, которая позволяет выделить верные ответы, свести к минимуму неопределенность и обеспечить формальные гарантии точности для LLM-выводов.
## Метод
Мы предлагаем **теорию информационно-высоты скелета** для селективной классификации. Наш подход основывается на **PAC-Bayes**-анализе, который расширяет стандартные бернуллиевские оценки, и включает в себя:
- **Под-гамма-анализ**, позволяющий оценивать вероятности ошибок с более высокой точностью;
- **Теоремы чувствительности скелета**, измеряющие устойчивость модели к неточностям в оценках;
- **Теория ошибочных режимов**, которая позволяет настраивать модель на понимание и контроль ошибок;
- **Вариационный метод** для точечной конструкции скелета, обеспечивающий эффективность и точность.
Метод адаптируется для работы с различными моделями LLMs и датасетами, чтобы обеспечить эффективность и универсальность.
## Результаты
Мы проверили наш подход на шести различных датасетах, включая задачи текстового классификации, генерации текста и ответа на вопросы. Модели, использующие нашу технологию, показали следующие результаты:
- Уменьшение неопределенности (abstention) на 12–15% с тем же уровнем риска;
- Задержка вычислений не превышала 20%, при этом с учетом батч-обработки эта стоимость может быть существенно снижена;
- Обеспечение формальных гарантий точности вывода в критичных сценариях.
Эти результаты доказывают устойчивость и эффективность нашего подхода в широком круге задач.
## Значимость
Наш подход может быть применен в **критически важных задачах**, таких как диагностика, финансовый мониторинг и юридические выводы, где точность и защита от неверных выводов критична. Он предлагает:
- **Формальные гарантии точности**, отсутствующие в предыдущих подходах;
- **Улучшение эффективности** за счет меньшей частоты отказа от вывода;
- **Универсальность**, применимаясь к различным моделям и сценариям использования.
Это дает во
Abstract
Large language models often produce plausible but incorrect outputs. Existing
heuristics such as HallBayes lack formal guarantees. We develop the first
comprehensive theory of \emph{information-lift certificates} under selective
classification. Our contributions are: (i) a PAC-Bayes \emph{sub-gamma}
analysis extending beyond standard Bernstein bounds; (ii) explicit skeleton
sensitivity theorems quantifying robustness to misspecification; (iii)
failure-mode guarantees under assumption violations; and (iv) a principled
variational method for skeleton construction. Across six datasets and multiple
model families, we validate assumptions empirically, reduce abstention by
12--15\% at the same risk, and maintain runtime overhead below 20\% (further
reduced via batching).
Ссылки и действия
Дополнительные ресурсы: