Model-enhanced Vector Index

Hailin Zhang; Yujing Wang; Qi Chen; Ruiheng Chang; Ting Zhang; Ziming; Miao; Yingyan Hou; Yang Ding; Xupeng Miao; Haonan Wang; Bochen Pang; Yuefeng; Zhan; Hao Sun; Weiwei Deng; Qi Zhang; Fan Yang; Xing Xie; Mao Yang; Bin Cui

arXiv:2309.13335·cs.IR·November 10, 2023

Model-enhanced Vector Index

Hailin Zhang, Yujing Wang, Qi Chen, Ruiheng Chang, Ting Zhang, Ziming, Miao, Yingyan Hou, Yang Ding, Xupeng Miao, Haonan Wang, Bochen Pang, Yuefeng, Zhan, Hao Sun, Weiwei Deng, Qi Zhang, Fan Yang, Xing Xie, Mao Yang, Bin Cui

PDF

Open Access 1 Repo 1 Video

TL;DR

This paper introduces MEVI, a novel vector index that combines deep generative models with embedding-based retrieval to improve accuracy while maintaining low latency and supporting document updates.

Contribution

The paper proposes MEVI, a differentiable, model-enhanced vector index using twin-tower models and residual quantization to improve retrieval performance and efficiency.

Findings

01

Achieves better performance on MSMARCO Passage and Natural Questions benchmarks.

02

Maintains comparable serving latency to dense retrieval methods.

03

Supports document updates effectively.

Abstract

Embedding-based retrieval methods construct vector indices to search for document representations that are most similar to the query representations. They are widely used in document retrieval due to low latency and decent recall performance. Recent research indicates that deep retrieval solutions offer better model quality, but are hindered by unacceptable serving latency and the inability to support document updates. In this paper, we aim to enhance the vector index with end-to-end deep generative models, leveraging the differentiable advantages of deep retrieval models while maintaining desirable serving efficiency. We propose Model-enhanced Vector Index (MEVI), a differentiable model-enhanced index empowered by a twin-tower representation model. MEVI leverages a Residual Quantization (RQ) codebook to bridge the sequence-to-sequence deep retrieval and embedding-based models. To…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

hugozhl/mevi
jaxOfficial

Videos

Model-enhanced Vector Index· slideslive

Taxonomy

TopicsTopic Modeling · Domain Adaptation and Few-Shot Learning · Multimodal Machine Learning Applications