Aya Expanse: Combining Research Breakthroughs for a New Multilingual   Frontier

John Dang; Shivalika Singh; Daniel D'souza; Arash Ahmadian; Alejandro; Salamanca; Madeline Smith; Aidan Peppin; Sungjin Hong; Manoj Govindassamy,; Terrence Zhao; Sandra Kublik; Meor Amer; Viraat Aryabumi; Jon Ander Campos,; Yi-Chern Tan; Tom Kocmi; Florian Strub; Nathan Grinsztajn; Yannis; Flet-Berliac; Acyr Locatelli; Hangyu Lin; Dwarak Talupuru; Bharat Venkitesh,; David Cairuz; Bowen Yang; Tim Chung; Wei-Yin Ko; Sylvie Shang Shi; Amir; Shukayev; Sammie Bae; Aleksandra Piktus; Roman Castagn\'e; Felipe; Cruz-Salinas; Eddie Kim; Lucas Crawhall-Stein; Adrien Morisot; Sudip Roy,; Phil Blunsom; Ivan Zhang; Aidan Gomez; Nick Frosst; Marzieh Fadaee; Beyza; Ermis; Ahmet \"Ust\"un; Sara Hooker

arXiv:2412.04261·cs.CL·December 6, 2024

Aya Expanse: Combining Research Breakthroughs for a New Multilingual Frontier

John Dang, Shivalika Singh, Daniel D'souza, Arash Ahmadian, Alejandro, Salamanca, Madeline Smith, Aidan Peppin, Sungjin Hong, Manoj Govindassamy,, Terrence Zhao, Sandra Kublik, Meor Amer, Viraat Aryabumi, Jon Ander Campos,, Yi-Chern Tan, Tom Kocmi, Florian Strub

PDF

10 Models 1 Datasets

TL;DR

Aya Expanse introduces a new family of large multilingual models that outperform existing models across 23 languages, setting a new state-of-the-art in multilingual NLP performance.

Contribution

The paper presents the Aya Expanse model family, combining research advancements to achieve superior multilingual performance and releasing open weights and a new multilingual evaluation dataset.

Findings

01

Aya Expanse models outperform leading open-weight models in multilingual tasks.

02

Aya Expanse 32B surpasses larger models like Llama 3.1 70B in win-rate.

03

The models achieve up to 76.6% win-rate on the Arena-Hard-Auto dataset.

Abstract

We introduce the Aya Expanse model family, a new generation of 8B and 32B parameter multilingual language models, aiming to address the critical challenge of developing highly performant multilingual models that match or surpass the capabilities of monolingual models. By leveraging several years of research at Cohere For AI and Cohere, including advancements in data arbitrage, multilingual preference training, and model merging, Aya Expanse sets a new state-of-the-art in multilingual performance. Our evaluations on the Arena-Hard-Auto dataset, translated into 23 languages, demonstrate that Aya Expanse 8B and 32B outperform leading open-weight models in their respective parameter classes, including Gemma 2, Qwen 2.5, and Llama 3.1, achieving up to a 76.6% win-rate. Notably, Aya Expanse 32B outperforms Llama 3.1 70B, a model with twice as many parameters, achieving a 54.0% win-rate. In…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Models

Datasets

CohereLabs/m-ArenaHard
dataset· 436 dl
436 dl

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

MethodsLLaMA