FusedANN: Convexified Hybrid ANN via Attribute-Vector Fusion

2509.19767v1 cs.IR, cs.AI, cs.DB, math.OC 2025-09-26

Авторы:

Alireza Heidari, Wei Zhang, Ying Xiong

Резюме на русском

#### Контекст Современные технологии, основанные на трансформерах, способны эффективно обрабатывать векторные запросы, но реальной практике часто требуются запросы, комбинирующие векторную схожесть с атрибутивными фильтрами. Например, поиск "лучшего документа в категории X, от 2023 года". Текущие решения часто требуют сбалансированного компромисса между выявлением (recall), скоростью и гибкостью. Они опираются на усложненные структуры индексов, которые не справляются с масштабированием. Мы предлагаем FusedANN (Fused Attribute-Vector Nearest Neighbor) — новую геометрическую модель, которая интегрирует фильтрацию в оптимизационные ограничения для АНН (ближайших соседей по векторам), используя релаксацию Лагранжа. Наш подход объединяет атрибуты и векторы в единую модель, превращая жесткие фильтры в непрерывные, взвешенные пенальти, сохраняя при этом топ-k семантику и эффективность поиска. #### Метод Мы предлагаем новую архитектуру FusedANN, основанную на трансформерах, которая соединяет векторные и атрибутивные пространства в единое пространство через ковексная формализация. Это позволяет превратить жесткие атрибутивные фильтры в непрерывные взвешенные задачи, которые могут быть эффективно разрешены с помощью оптимизационных методов. Фильтры воспринимаются как постоянные критерии, но с весами, которые могут быть урезаны в случае невозможности точного соответствия. Эта гибкость позволяет гарантировать top-k результаты, даже при неполном соответствии. Мы также доказываем, что FusedANN сохраняет гарантии аппроксимации АНН и может быть легко адаптирован для различных задач. #### Результаты Мы провели эксперименты с FusedANN на стандартных бенчмарках для систем гибридного поиска. Наши результаты показывают, что FusedANN превосходит текущие системы гибридного и графового поиска, достигая до 3 раз вышей пропускной способности и более высокой точности. Мы также проверили FusedANN на реальных задачах, в которых требовалась как точность, так и быстрота. Наши результаты показали, что FusedANN не только обеспечивает высокую производительность, но и позволяет удалить ненужные слои фильтрации, что упрощает инфраструктуру и повышает надежность. #### Значимость FusedANN может быть применен в различных областях, включая модели естественного языка, модели машинного обучения и другие приложения, требующие быстрого и точного поиска. Он предлагает новый подход к решению задач связывания векторных данных с атрибутивными фильтрами, который является более эффективным и гибким по сравнению с существующими техно

Abstract

Vector search powers transformers technology, but real-world use demands hybrid queries that combine vector similarity with attribute filters (e.g., "top document in category X, from 2023"). Current solutions trade off recall, speed, and flexibility, relying on fragile index hacks that don't scale. We introduce FusedANN (Fused Attribute-Vector Nearest Neighbor), a geometric framework that elevates filtering to ANN optimization constraints and introduces a convex fused space via a Lagrangian-like relaxation. Our method jointly embeds attributes and vectors through transformer-based convexification, turning hard filters into continuous, weighted penalties that preserve top-k semantics while enabling efficient approximate search. We prove that FusedANN reduces to exact filtering under high selectivity, gracefully relaxes to semantically nearest attributes when exact matches are insufficient, and preserves downstream ANN alpha-approximation guarantees. Empirically, FusedANN improves query throughput by eliminating brittle filtering stages, achieving superior recall-latency tradeoffs on standard hybrid benchmarks without specialized index hacks, delivering up to 3 times higher throughput and better recall than state-of-the-art hybrid and graph-based systems. Theoretically, we provide explicit error bounds and parameter selection rules that make FusedANN practical for production. This establishes a principled, scalable, and verifiable bridge between symbolic constraints and vector similarity, unlocking a new generation of filtered retrieval systems for large, hybrid, and dynamic NLP/ML workloads.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация