Document Summarization with Conformal Importance Guarantees

2509.20461v1 cs.CL, cs.LG 2025-09-27
Авторы:

Bruce Kuwahara, Chen-Yuan Lin, Xiao Shi Huang, Kin Kwan Leung, Jullian Arta Yapeter, Ilya Stanevich, Felipe Perez, Jesse C. Cresswell

Резюме на русском

```## Контекст В статье рассматривается развитие автоматических систем автоматической суммирования документов с помощью больших языковых моделей (LLMs). Несмотря на значительные достижения в области LLMs, существуют значительные проблемы, связанные с отсутствием гарантий по включению критической информации в выделенные сводки, особенно в критических сферах, таких как здравоохранение, право и финансы. Эти проблемы могут привести к негативным последствиям, таким как ошибки в решающих процессах или недостаточность информации для принятия решений. Основная мотивация заключается в том, чтобы разработать метод, который обеспечивал бы гарантии по включению критической информации в автоматические сводки, уменьшая риски по неточности или пропускам важной информации. ## Метод Разработанная методика, названа **Conformal Importance Summarization**, основывается на подходе **conformal prediction** для обеспечения гарантий по включению критической информации. Метод работает с **sentence-level importance scores**, которые формируются на основе универсальных представлений текста из LLMs. Техника позволяет устанавливать пользовательские требования к **coverage и recall** для важной информации. Метод является **model-agnostic**, то есть может использоваться совместно с любыми LLMs без изменения их основной архитектуры. Он требует только небольшого **calibration set** для настройки гиперпараметров. Это позволяет ему быть мощным инструментом для применения в различных текстовых задачах, включая суммирования документов. ## Результаты На экспериментальных данных, взятых из популярных бенчмарков, таких как CNN/Daily Mail, наши результаты показывают, что Conformal Importance Summarization достигает теоретически обоснованных **coverage rates**, обеспечивая критическую информацию в выделенных сводках. Метод показал высокую **recall** и **precision** в сравнении с другими подходами, включая существующие методы, которые не обеспечивают гарантий по включению критической информации. ## Значимость Важность этого исследования заключается в том, что он предоставляет новый подход к решению проблемы недостатка гарантий в суммировании документов. Полученная методика может быть применена в критических сферах, где важность включения всей критической информации критична, таких как **legal analysis**, **medical documentation**, и **financial reporting**. Одним из основных преимуществ этого подхода является его универсальность и модельно-независимость, что делает его легко применяемым в различных существующих системах. ## Выводы Метод Conformal Importance Summarization представляет собой значительный шаг в области automatic summarization, обеспечивая гарантии по включению критической информации. Дальнейшие исследования будут сфокусированы

Abstract

Automatic summarization systems have advanced rapidly with large language models (LLMs), yet they still lack reliable guarantees on inclusion of critical content in high-stakes domains like healthcare, law, and finance. In this work, we introduce Conformal Importance Summarization, the first framework for importance-preserving summary generation which uses conformal prediction to provide rigorous, distribution-free coverage guarantees. By calibrating thresholds on sentence-level importance scores, we enable extractive document summarization with user-specified coverage and recall rates over critical content. Our method is model-agnostic, requires only a small calibration set, and seamlessly integrates with existing black-box LLMs. Experiments on established summarization benchmarks demonstrate that Conformal Importance Summarization achieves the theoretically assured information coverage rate. Our work suggests that Conformal Importance Summarization can be combined with existing techniques to achieve reliable, controllable automatic summarization, paving the way for safer deployment of AI summarization tools in critical applications. Code is available at https://github.com/layer6ai-labs/conformal-importance-summarization.

Ссылки и действия