ELViS: Efficient Visual Similarity from Local Descriptors that Generalizes Across Domains

Pavel Suma; Giorgos Kordopatis-Zilos; Yannis Kalantidis; Giorgos Tolias

arXiv:2603.28603·cs.CV·March 31, 2026

ELViS: Efficient Visual Similarity from Local Descriptors that Generalizes Across Domains

Pavel Suma, Giorgos Kordopatis-Zilos, Yannis Kalantidis, Giorgos Tolias

PDF

1 Repo 1 Video

TL;DR

ELViS is a novel image similarity model that generalizes across diverse domains by operating in similarity space, leveraging local descriptors, optimal transport, and voting for efficient, interpretable retrieval.

Contribution

The paper introduces ELViS, a new similarity-based model that outperforms existing methods in cross-domain image retrieval with lower computational cost.

Findings

01

ELViS outperforms competing methods in out-of-domain scenarios.

02

ELViS requires significantly less computational resources.

03

ELViS achieves high accuracy across diverse datasets.

Abstract

Large-scale instance-level training data is scarce, so models are typically trained on domain-specific datasets. Yet in real-world retrieval, they must handle diverse domains, making generalization to unseen data critical. We introduce ELViS, an image-to-image similarity model that generalizes effectively to unseen domains. Unlike conventional approaches, our model operates in similarity space rather than representation space, promoting cross-domain transfer. It leverages local descriptor correspondences, refines their similarities through an optimal transport step with data-dependent gains that suppress uninformative descriptors, and aggregates strong correspondences via a voting process into an image-level similarity. This design injects strong inductive biases, yielding a simple, efficient, and interpretable model. To assess generalization, we compile a benchmark of eight datasets…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

pavelsuma/ELViS
github

Videos

ELViS: Efficient Visual Similarity from Local Descriptors that Generalizes Across Domains· slideslive