LAGO: Few-shot Crosslingual Embedding Inversion Attacks via Language Similarity-Aware Graph Optimization

Wenrui Yu; Yiyi Chen; Johannes Bjerva; Sokol Kosta; Qiongxiu Li

arXiv:2505.16008·cs.CL·May 23, 2025

LAGO: Few-shot Crosslingual Embedding Inversion Attacks via Language Similarity-Aware Graph Optimization

Wenrui Yu, Yiyi Chen, Johannes Bjerva, Sokol Kosta, Qiongxiu Li

PDF

TL;DR

LAGO introduces a graph-based optimization method that leverages language similarities to enhance few-shot cross-lingual embedding inversion attacks, revealing privacy vulnerabilities in multilingual NLP systems.

Contribution

It models linguistic relationships via a graph framework, generalizing prior methods and improving attack transferability with limited data.

Findings

01

LAGO outperforms baselines with 10-20% higher Rouge-L scores.

02

Language similarity significantly impacts attack transferability.

03

The approach is effective across multiple languages and embedding models.

Abstract

We propose LAGO - Language Similarity-Aware Graph Optimization - a novel approach for few-shot cross-lingual embedding inversion attacks, addressing critical privacy vulnerabilities in multilingual NLP systems. Unlike prior work in embedding inversion attacks that treat languages independently, LAGO explicitly models linguistic relationships through a graph-based constrained distributed optimization framework. By integrating syntactic and lexical similarity as edge constraints, our method enables collaborative parameter learning across related languages. Theoretically, we show this formulation generalizes prior approaches, such as ALGEN, which emerges as a special case when similarity constraints are relaxed. Our framework uniquely combines Frobenius-norm regularization with linear inequality or total variation constraints, ensuring robust alignment of cross-lingual embedding spaces…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

MethodsFocus