Decision-Making with Deliberation: Meta-reviewing as a Document-grounded Dialogue

2508.05283v1 cs.CL 2025-08-09
Авторы:

Sukannya Purkayastha, Nils Dycke, Anne Lauscher, Iryna Gurevych

Резюме на русском

Мета-рецензирование является ключевым этапом в peer-review процессе, определяющим рекомендации по принятию или отклонению статьи. Однако данный процесс представляет собой не только суммирование рецензентских аргументов, но и решающую часть, требующую взвешивания этих аргументов в широком контексте. Несмотря на исследования по использованию диалоговых агентов для поддержки решений, данная область остается мало исследована. Для повышения эффективности мета-рецензирования, авторы предлагают адаптировать диалоговые агенты с помощью генерации синтетических данных с помощью Large Language Models (LLMs) с использованием стратегии self-refinement для улучшения весомости диалогов в контексте экспертных доменов. Исследования показали, что выдаваемые данными агенты показали лучшую эффективность по сравнению с обычными LLM-based ассистентами и доказали свою эффективность в реальном мета-рецензировании.

Abstract

Meta-reviewing is a pivotal stage in the peer-review process, serving as the final step in determining whether a paper is recommended for acceptance. Prior research on meta-reviewing has treated this as a summarization problem over review reports. However, complementary to this perspective, meta-reviewing is a decision-making process that requires weighing reviewer arguments and placing them within a broader context. Prior research has demonstrated that decision-makers can be effectively assisted in such scenarios via dialogue agents. In line with this framing, we explore the practical challenges for realizing dialog agents that can effectively assist meta-reviewers. Concretely, we first address the issue of data scarcity for training dialogue agents by generating synthetic data using Large Language Models (LLMs) based on a self-refinement strategy to improve the relevance of these dialogues to expert domains. Our experiments demonstrate that this method produces higher-quality synthetic data and can serve as a valuable resource towards training meta-reviewing assistants. Subsequently, we utilize this data to train dialogue agents tailored for meta-reviewing and find that these agents outperform \emph{off-the-shelf} LLM-based assistants for this task. Finally, we apply our agents in real-world meta-reviewing scenarios and confirm their effectiveness in enhancing the efficiency of meta-reviewing.\footnote{Code and Data: https://github.com/UKPLab/arxiv2025-meta-review-as-dialog

Ссылки и действия