Uncovering the Bigger Picture: Comprehensive Event Understanding Via Diverse News Retrieval

2508.19758v1 cs.CL, cs.IR 2025-08-29
Авторы:

Yixuan Tang, Yuanyuan Shi, Yiqun Sun, Anthony Kum Hoe Tung

Резюме на русском

## Контекст Правильное понимание событий требует объединения различных точек зрения. Однако существующие системы поиска новостей стремятся к текстовой релевантности, что приводит к повторяющимся результатам и ограниченному количеству точек зрения. Это снижает качество понимания событий. Мы предлагаем NEWSCOPE — рамочную модель для разнообразного поиска новостей, которая улучшает комплексное понимание событий за счет учета семантической разнообразности на уровне предложений. ## Метод NEWSCOPE представляет собой двухступенчатую архитектуру. В первой стадии используется плотный поиск для нахождения топически относительных статей. Во второй стадии применяется кластеризация предложений и диверсифицирующий рейтинг для выделения дополнительных точек зрения. Для оценки разнообразия мы предлагаем три метрики: средняя парная разница, покрытие положительных кластеров и отношение информативности. Также мы создали две новые бенчмарки: LocalNews и DSGlobal, охватывающие параграфы. ## Результаты Наши эксперименты показали, что NEWSCOPE постоянно превосходит основные базовые системы, достигая высокой разнообразности без потерь в релевантности. Мы также провели сравнение с другими моделями, установив, что наш подход значительно улучшает понимание событий, уменьшая повторения и расширяя представление. ## Значимость Модель NEWSCOPE может применяться в поиске новостей, мониторинге событий и анализе массовых сообщений. Ее преимущества заключаются в повышении разнообразия результатов и полноты понимания событий. Будущие исследования будут сфокусированы на улучшении эффективности и многообразия алгоритмов кластеризации. ## Выводы Мы представили новую рамочную модель для поиска новостей, которая основывается на диверсификации на уровне предложений. Наши результаты показывают, что NEWSCOPE эффективно решает проблемы повторения и ограниченности точек зрения, способствуя полному пониманию событий.

Abstract

Access to diverse perspectives is essential for understanding real-world events, yet most news retrieval systems prioritize textual relevance, leading to redundant results and limited viewpoint exposure. We propose NEWSCOPE, a two-stage framework for diverse news retrieval that enhances event coverage by explicitly modeling semantic variation at the sentence level. The first stage retrieves topically relevant content using dense retrieval, while the second stage applies sentence-level clustering and diversity-aware re-ranking to surface complementary information. To evaluate retrieval diversity, we introduce three interpretable metrics, namely Average Pairwise Distance, Positive Cluster Coverage, and Information Density Ratio, and construct two paragraph-level benchmarks: LocalNews and DSGlobal. Experiments show that NEWSCOPE consistently outperforms strong baselines, achieving significantly higher diversity without compromising relevance. Our results demonstrate the effectiveness of fine-grained, interpretable modeling in mitigating redundancy and promoting comprehensive event understanding. The data and code are available at https://github.com/tangyixuan/NEWSCOPE.

Ссылки и действия