Optimization of Latent-Space Compression using Game-Theoretic Techniques for Transformer-Based Vector Search

2508.18877v1 cs.IR, cs.AI, cs.LG 2025-08-28
Авторы:

Kushagra Agrawal, Nisharg Nargund, Oishani Banerjee

Резюме на русском

## Контекст Системы векторного поиска на основе трансформеров становятся важным средством для модернизации информационных систем. Они позволяют выполнять точный поиск похожих документов или объектов в больших корпусах данных. Однако высокая размерность ло LATEX_LATEXテーブル的ных представлений, используемых в таких системах, приводит к затруднениям в скалярной эффективности и емкости хранения. Эти проблемы чрезвычайно важны в сегменте систем, основанных на трансформерах, где эффективность и точность играют ключевую роль. Наша мотивация заключается в развитии уникального подхода, который позволит совмещать высокую точность поиска с эффективным использованием ресурсов. ## Метод Мы предлагаем инновационную модель, основанную на игровых теориях, для оптимизации компрессии в пространстве латентного вектора. Наша модель рассматривает компрессию как игру с целью баланса между точностью поиска и эффективностью хранения. Эта модель состоит из двух ключевых этапов: 1) идентификации стратегий, которые минимизируют убытки точности при поиске, при этом снижая цену хранения, и 2) использование геометрических оптимизационных приемов для максимизации семантической схожести в ограниченном пространстве. Мы также использовали адаптивные методы, чтобы обеспечить совместимость с текущими трансформер-ориентированными системами поиска. ## Результаты Были проведены эксперименты для сравнения нашей модели с широко используемой библиотекой FAISS. Мы замерили схожесть в поиске и эффективность поиска в разных сценариях. Наши результаты показали, что наш подход достиг средней точности поиска 0.9981 в сравнении с 0.5517 для FAISS. Была также достигнута высокая эффективность, с увеличением времени запроса на 10%, что свидетельствует о балансе между точностью и скоростью. Эти результаты подтвердили преимущество нашей модели в трансформер-ориентированных системах поиска. ## Значимость Наш подход может быть применен в различных приложениях, таких как моделирование языка, видео- и изображенческий поиск, а также в системах анализа больших данных. Он предоставляет высокую точность в поиске, эффективное использование ресурсов, а также способность работать с трансформер-ориентированными системами. Это сочетание преимуществ делает нашу модель привлекательной для повышения эффективности и точности в системах баз данных и поисковых систем. ## Выводы Мы представили модель оптимизации компрессии пространства латентного вектора с помощью игровых теорий, которая достигает высокой точност

Abstract

Vector similarity search plays a pivotal role in modern information retrieval systems, especially when powered by transformer-based embeddings. However, the scalability and efficiency of such systems are often hindered by the high dimensionality of latent representations. In this paper, we propose a novel game-theoretic framework for optimizing latent-space compression to enhance both the efficiency and semantic utility of vector search. By modeling the compression strategy as a zero-sum game between retrieval accuracy and storage efficiency, we derive a latent transformation that preserves semantic similarity while reducing redundancy. We benchmark our method against FAISS, a widely-used vector search library, and demonstrate that our approach achieves a significantly higher average similarity (0.9981 vs. 0.5517) and utility (0.8873 vs. 0.5194), albeit with a modest increase in query time. This trade-off highlights the practical value of game-theoretic latent compression in high-utility, transformer-based search applications. The proposed system can be seamlessly integrated into existing LLM pipelines to yield more semantically accurate and computationally efficient retrieval.

Ссылки и действия