Uncovering the Bigger Picture: Comprehensive Event Understanding Via Diverse News Retrieval
2508.19758v1
cs.CL, cs.IR
2025-08-29
Авторы:
Yixuan Tang, Yuanyuan Shi, Yiqun Sun, Anthony Kum Hoe Tung
Резюме на русском
## Контекст
Правильное понимание событий требует объединения различных точек зрения. Однако существующие системы поиска новостей стремятся к текстовой релевантности, что приводит к повторяющимся результатам и ограниченному количеству точек зрения. Это снижает качество понимания событий. Мы предлагаем NEWSCOPE — рамочную модель для разнообразного поиска новостей, которая улучшает комплексное понимание событий за счет учета семантической разнообразности на уровне предложений.
## Метод
NEWSCOPE представляет собой двухступенчатую архитектуру. В первой стадии используется плотный поиск для нахождения топически относительных статей. Во второй стадии применяется кластеризация предложений и диверсифицирующий рейтинг для выделения дополнительных точек зрения. Для оценки разнообразия мы предлагаем три метрики: средняя парная разница, покрытие положительных кластеров и отношение информативности. Также мы создали две новые бенчмарки: LocalNews и DSGlobal, охватывающие параграфы.
## Результаты
Наши эксперименты показали, что NEWSCOPE постоянно превосходит основные базовые системы, достигая высокой разнообразности без потерь в релевантности. Мы также провели сравнение с другими моделями, установив, что наш подход значительно улучшает понимание событий, уменьшая повторения и расширяя представление.
## Значимость
Модель NEWSCOPE может применяться в поиске новостей, мониторинге событий и анализе массовых сообщений. Ее преимущества заключаются в повышении разнообразия результатов и полноты понимания событий. Будущие исследования будут сфокусированы на улучшении эффективности и многообразия алгоритмов кластеризации.
## Выводы
Мы представили новую рамочную модель для поиска новостей, которая основывается на диверсификации на уровне предложений. Наши результаты показывают, что NEWSCOPE эффективно решает проблемы повторения и ограниченности точек зрения, способствуя полному пониманию событий.
Abstract
Access to diverse perspectives is essential for understanding real-world
events, yet most news retrieval systems prioritize textual relevance, leading
to redundant results and limited viewpoint exposure. We propose NEWSCOPE, a
two-stage framework for diverse news retrieval that enhances event coverage by
explicitly modeling semantic variation at the sentence level. The first stage
retrieves topically relevant content using dense retrieval, while the second
stage applies sentence-level clustering and diversity-aware re-ranking to
surface complementary information. To evaluate retrieval diversity, we
introduce three interpretable metrics, namely Average Pairwise Distance,
Positive Cluster Coverage, and Information Density Ratio, and construct two
paragraph-level benchmarks: LocalNews and DSGlobal. Experiments show that
NEWSCOPE consistently outperforms strong baselines, achieving significantly
higher diversity without compromising relevance. Our results demonstrate the
effectiveness of fine-grained, interpretable modeling in mitigating redundancy
and promoting comprehensive event understanding. The data and code are
available at https://github.com/tangyixuan/NEWSCOPE.
Ссылки и действия
Дополнительные ресурсы: