Navigating Through Paper Flood: Advancing LLM-based Paper Evaluation through Domain-Aware Retrieval and Latent Reasoning
2508.05129v1
cs.IR, cs.CL
2025-08-09
Авторы:
Wuqiang Zheng, Yiyan Xu, Xinyu Lin, Chongming Gao, Wenjie Wang, Fuli Feng
Резюме на русском
Огромный поток научных работ сделал их оценку на основе качества и значимости задачу, требующей новых подходов. Логическими и разумными они могут быть, но часто ограничены устаревшим доменным знанием или недостаточной способностью применять полное внимание к контексту. Работа предлагает PaperEval — фреймворк, основанный на Large Language Models, для автоматизированной оценки научных работ. Он включает модуль доменно-ориентированного восстановления, позволяющий получать свежую и актуальную информацию, и логическую модель для углубленного анализа мотивации, методики и сравнения с современной конкуренцией. Для точного определения существенных отличий вводится стратегия прогрессивной оптимизации рейтинга. PaperEval показал существенное превосходство на двух датасетах и применен в реальной системе рекомендации для фильтрации высококачественных работ. Он получил широкую популярность в социальных сетях, подтвердив свою практическую эффективность.
Abstract
With the rapid and continuous increase in academic publications, identifying
high-quality research has become an increasingly pressing challenge. While
recent methods leveraging Large Language Models (LLMs) for automated paper
evaluation have shown great promise, they are often constrained by outdated
domain knowledge and limited reasoning capabilities. In this work, we present
PaperEval, a novel LLM-based framework for automated paper evaluation that
addresses these limitations through two key components: 1) a domain-aware paper
retrieval module that retrieves relevant concurrent work to support
contextualized assessments of novelty and contributions, and 2) a latent
reasoning mechanism that enables deep understanding of complex motivations and
methodologies, along with comprehensive comparison against concurrently related
work, to support more accurate and reliable evaluation. To guide the reasoning
process, we introduce a progressive ranking optimization strategy that
encourages the LLM to iteratively refine its predictions with an emphasis on
relative comparison. Experiments on two datasets demonstrate that PaperEval
consistently outperforms existing methods in both academic impact and paper
quality evaluation. In addition, we deploy PaperEval in a real-world paper
recommendation system for filtering high-quality papers, which has gained
strong engagement on social media -- amassing over 8,000 subscribers and
attracting over 10,000 views for many filtered high-quality papers --
demonstrating the practical effectiveness of PaperEval.
Ссылки и действия
Дополнительные ресурсы: