CFDA & CLIP at TREC iKAT 2025: Enhancing Personalized Conversational Search via Query Reformulation and Rank Fusion
2509.15588v1
cs.IR, cs.AI
2025-09-23
Авторы:
Yu-Cheng Chang, Guan-Wei Yeo, Quah Eugene, Fan-Jie Shih, Yuan-Ching Kuo, Tsung-En Yu, Hung-Chun Hsu, Ming-Feng Tsai, Chuan-Ju Wang
Резюме на русском
## Контекст
Современное интеллектуальное помощничество в сфере поиска информации стремится к более естественным и эффективным способам взаимодействия с пользователями. Одним из ключевых вызовов является улучшение личных поисковых рекомендаций, которые должны учитывать предпочтения пользователя, предыдущие запросы и контекстный контент. Несмотря на прогресс в области контентной лингвистики и моделей естественного языка, требования к реальному времени и эффективности часто ограничивают возможности полного использования этих моделей в реальных системах поиска. Таким образом, важно разработать стратегии, которые обеспечивают адекватное балансирование между точностью, эффективностью и надежностью. В этом контексте проводится рассмотрение проблемы в TREC Interactive Knowledge Assistance Track (iKAT) 2025, которая призвана расширить знания о конвергенции технических решений для повышения качества пользовательских взаимодействий с поисковой системой.
## Метод
Задача разработки системы для поддержки пользовательского поиска решается с помощью комбинированных подходов к реформулировке запросов и стратегиям фюзирования рейтингов. Алгоритмы CFDA и CLIP используются для реформулировки запросов, чтобы улучшить их точность и релевантность. Для обеспечения эффективности в работе с большими объемами данных применяется Reciprocal Rank Fusion (RRF) для интеграции результатов из разных источников. Также используется Best-of-$N$ стратегия для выбора наиболее подходящих результатов в рамках ограничений реального времени. Архитектура системы представляет собой комбинацию этих компонентов, что позволяет выполнить операции как в реальном времени, так и в условиях определенных экспериментов с фиксированными данными.
## Результаты
Проведены эксперименты с использованием данных из TREC iKAT 2025, включая задачи интерактивного и оффлайнного поиска. Результаты показали, что стратегия реформулирования запросов CFDA & CLIP способна улучшить точность и соответствие пользовательским запросам. Фюзирование рейтингов RRF и стратегия Best-of-$N$ позволяют достичь более устойчивых и эффективных результатов в разных условиях. Однако были выявлены торможения, связанные с увеличением времени обработки при повышении степени детализации и комплексности запросов. Эти результаты подтверждают значимость стратегий, но также указывают на необходимость дальнейших исследований для повышения производительности.
## Значимость
Разработанная система имеет потенциал для применения в различных сферах, включая поисковые системы, медицинский поиск, юридический поиск и другие области, где точность и эффективность важны
Abstract
The 2025 TREC Interactive Knowledge Assistance Track (iKAT) featured both
interactive and offline submission tasks. The former requires systems to
operate under real-time constraints, making robustness and efficiency as
important as accuracy, while the latter enables controlled evaluation of
passage ranking and response generation with pre-defined datasets. To address
this, we explored query rewriting and retrieval fusion as core strategies. We
built our pipelines around Best-of-$N$ selection and Reciprocal Rank Fusion
(RRF) strategies to handle different submission tasks. Results show that
reranking and fusion improve robustness while revealing trade-offs between
effectiveness and efficiency across both tasks.
Ссылки и действия
Дополнительные ресурсы: