CFDA & CLIP at TREC iKAT 2025: Enhancing Personalized Conversational Search via Query Reformulation and Rank Fusion

2509.15588v1 cs.IR, cs.AI 2025-09-23
Авторы:

Yu-Cheng Chang, Guan-Wei Yeo, Quah Eugene, Fan-Jie Shih, Yuan-Ching Kuo, Tsung-En Yu, Hung-Chun Hsu, Ming-Feng Tsai, Chuan-Ju Wang

Резюме на русском

## Контекст Современное интеллектуальное помощничество в сфере поиска информации стремится к более естественным и эффективным способам взаимодействия с пользователями. Одним из ключевых вызовов является улучшение личных поисковых рекомендаций, которые должны учитывать предпочтения пользователя, предыдущие запросы и контекстный контент. Несмотря на прогресс в области контентной лингвистики и моделей естественного языка, требования к реальному времени и эффективности часто ограничивают возможности полного использования этих моделей в реальных системах поиска. Таким образом, важно разработать стратегии, которые обеспечивают адекватное балансирование между точностью, эффективностью и надежностью. В этом контексте проводится рассмотрение проблемы в TREC Interactive Knowledge Assistance Track (iKAT) 2025, которая призвана расширить знания о конвергенции технических решений для повышения качества пользовательских взаимодействий с поисковой системой. ## Метод Задача разработки системы для поддержки пользовательского поиска решается с помощью комбинированных подходов к реформулировке запросов и стратегиям фюзирования рейтингов. Алгоритмы CFDA и CLIP используются для реформулировки запросов, чтобы улучшить их точность и релевантность. Для обеспечения эффективности в работе с большими объемами данных применяется Reciprocal Rank Fusion (RRF) для интеграции результатов из разных источников. Также используется Best-of-$N$ стратегия для выбора наиболее подходящих результатов в рамках ограничений реального времени. Архитектура системы представляет собой комбинацию этих компонентов, что позволяет выполнить операции как в реальном времени, так и в условиях определенных экспериментов с фиксированными данными. ## Результаты Проведены эксперименты с использованием данных из TREC iKAT 2025, включая задачи интерактивного и оффлайнного поиска. Результаты показали, что стратегия реформулирования запросов CFDA & CLIP способна улучшить точность и соответствие пользовательским запросам. Фюзирование рейтингов RRF и стратегия Best-of-$N$ позволяют достичь более устойчивых и эффективных результатов в разных условиях. Однако были выявлены торможения, связанные с увеличением времени обработки при повышении степени детализации и комплексности запросов. Эти результаты подтверждают значимость стратегий, но также указывают на необходимость дальнейших исследований для повышения производительности. ## Значимость Разработанная система имеет потенциал для применения в различных сферах, включая поисковые системы, медицинский поиск, юридический поиск и другие области, где точность и эффективность важны

Abstract

The 2025 TREC Interactive Knowledge Assistance Track (iKAT) featured both interactive and offline submission tasks. The former requires systems to operate under real-time constraints, making robustness and efficiency as important as accuracy, while the latter enables controlled evaluation of passage ranking and response generation with pre-defined datasets. To address this, we explored query rewriting and retrieval fusion as core strategies. We built our pipelines around Best-of-$N$ selection and Reciprocal Rank Fusion (RRF) strategies to handle different submission tasks. Results show that reranking and fusion improve robustness while revealing trade-offs between effectiveness and efficiency across both tasks.

Ссылки и действия