Multilingual Multi-Label Emotion Classification at Scale with Synthetic Data

Vadim Borisov

arXiv:2604.12633·cs.CL·April 15, 2026

Multilingual Multi-Label Emotion Classification at Scale with Synthetic Data

Vadim Borisov

PDF

1 Repo 2 Models

TL;DR

This paper introduces a large-scale synthetic multilingual dataset for multi-label emotion classification across 23 languages, and evaluates transformer models, achieving high performance and multilingual support.

Contribution

It creates and uses a synthetic dataset covering 23 languages for emotion classification, enabling multilingual training and evaluation at scale.

Findings

01

XLM-R-Large achieves 0.868 F1-micro on in-domain test set.

02

Models perform competitively on zero-shot English benchmarks.

03

The best base model is publicly available at the provided URL.

Abstract

Emotion classification in multilingual settings remains constrained by the scarcity of annotated data: existing corpora are predominantly English, single-label, and cover few languages. We address this gap by constructing a large-scale synthetic training corpus of over 1M multi-label samples (50k per language) across 23 languages: Arabic, Bengali, Dutch, English, French, German, Hindi, Indonesian, Italian, Japanese, Korean, Mandarin, Polish, Portuguese, Punjabi, Russian, Spanish, Swahili, Tamil, Turkish, Ukrainian, Urdu, and Vietnamese, covering 11 emotion categories using culturally-adapted generation and programmatic quality filtering. We train and compare six multilingual transformer encoders, from DistilBERT (135M parameters) to XLM-R-Large (560M parameters), under identical conditions. On our in-domain test set, XLM-R-Large achieves 0.868 F1-micro and 0.987 AUC-micro. To validate…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

https://huggingface.co/tabularisai/multilingual-emotion-classification
github

Models

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.