## Контекст
Современные боLковознарочные модели (LLM) эффективно используются в репасовом поиске, оС других стоLах. Однако использование LLM для расширения пасажей (пасажиров) часто приводит к проблемам, такLо как дрейфу смыслов и несоответствию семантического пространства, на котором они были обучены. Большая часть ранее предложенных методов расширения пасажей ориентирована на то, чтобы улучшить не только значимость фрагментов, но и их значимость для семантического моделирования. Кроме того, значимая часть ранее предложенных методов полагается на дополнительную информацию, такLо как доменные сведения, что делает их менее универсальными. Наша мотивированая модель "CLAP" (Coreference-Linked Augmentation for Passage Retrieval) предлагает новую архитектуру, которая обеспечивает более точное и глубокое понимание текста, решая проблему дрейфа смыслов и несоответствия семантического пространства.
## Метод
Метод CLAP состоит в том, чтобы разделить пасажи на понятные фрагменты, выявить отношения между этими фрагментами, а затем создать подпробелы, которые будут дополнять пасажи. Основные шаги в том, чтобы разбить пасажи на атомарные фрагменты, которые относятся к одному смыслу и имеют собственную семантическую структуру. Затем, мы разрешаем цепочки знаков, чтобы улучшить понимание значимости. Наконец, мы генерируем подпробелы, которые учитывают топологические связи и не только фрагменты. Это позволяет нашей модели лучше понимать смысл пасажа и сопоставлять его с запросом.
## Результаты
Мы провели ряд экспериментов, используя различные данные, в том числе MS MARCO, TREC DL и Natural Questions. Мы сравнивали нашу модель CLAP с другими методами расширения пасажей, такими как BM25, DPR и BM25 + MonoT5. Эксперименты показали, что CLAP улучшает эффективность поиска, увеличивая absolute nDCG@10 с 20.68% в сравнении с другими методами. Мы также показали, что CLAP имеет высокую гибкость и показывает свою эффективность при работе в разных доменах. Эти результаты подтверждают то, что CLAP является более универсальной моделью, чем многие другие, которые могут испытывать проблемы при работе в разных контекстах.
## Значимость
CLAP является полезной в разных областях, в том числе в поиске информации, в системах рекомендаций и в работе с большими данными. Одним из основных преимуществ является ее универсальность и доступность в разных доменах, не требующей дополнительной информации. Это позволяет CLAP использоваться в различных системах, которые требуют более точного понимания текста. Мы также полагаем, что в будущем CLAP может быть использована для улучшения систем заданий, которые