Navigating Through Paper Flood: Advancing LLM-based Paper Evaluation through Domain-Aware Retrieval and Latent Reasoning

2508.05129v1 cs.IR, cs.CL 2025-08-09
Авторы:

Wuqiang Zheng, Yiyan Xu, Xinyu Lin, Chongming Gao, Wenjie Wang, Fuli Feng

Резюме на русском

Огромный поток научных работ сделал их оценку на основе качества и значимости задачу, требующей новых подходов. Логическими и разумными они могут быть, но часто ограничены устаревшим доменным знанием или недостаточной способностью применять полное внимание к контексту. Работа предлагает PaperEval — фреймворк, основанный на Large Language Models, для автоматизированной оценки научных работ. Он включает модуль доменно-ориентированного восстановления, позволяющий получать свежую и актуальную информацию, и логическую модель для углубленного анализа мотивации, методики и сравнения с современной конкуренцией. Для точного определения существенных отличий вводится стратегия прогрессивной оптимизации рейтинга. PaperEval показал существенное превосходство на двух датасетах и применен в реальной системе рекомендации для фильтрации высококачественных работ. Он получил широкую популярность в социальных сетях, подтвердив свою практическую эффективность.

Abstract

With the rapid and continuous increase in academic publications, identifying high-quality research has become an increasingly pressing challenge. While recent methods leveraging Large Language Models (LLMs) for automated paper evaluation have shown great promise, they are often constrained by outdated domain knowledge and limited reasoning capabilities. In this work, we present PaperEval, a novel LLM-based framework for automated paper evaluation that addresses these limitations through two key components: 1) a domain-aware paper retrieval module that retrieves relevant concurrent work to support contextualized assessments of novelty and contributions, and 2) a latent reasoning mechanism that enables deep understanding of complex motivations and methodologies, along with comprehensive comparison against concurrently related work, to support more accurate and reliable evaluation. To guide the reasoning process, we introduce a progressive ranking optimization strategy that encourages the LLM to iteratively refine its predictions with an emphasis on relative comparison. Experiments on two datasets demonstrate that PaperEval consistently outperforms existing methods in both academic impact and paper quality evaluation. In addition, we deploy PaperEval in a real-world paper recommendation system for filtering high-quality papers, which has gained strong engagement on social media -- amassing over 8,000 subscribers and attracting over 10,000 views for many filtered high-quality papers -- demonstrating the practical effectiveness of PaperEval.

Ссылки и действия