The Llama 3 Herd of Models

Aaron Grattafiori; Abhimanyu Dubey; Abhinav Jauhri; Abhinav Pandey,; Abhishek Kadian; Ahmad Al-Dahle; Aiesha Letman; Akhil Mathur; Alan Schelten,; Alex Vaughan; Amy Yang; Angela Fan; Anirudh Goyal; Anthony Hartshorn; Aobo; Yang; Archi Mitra; Archie Sravankumar; Artem Korenev; Arthur Hinsvark; Arun; Rao; Aston Zhang; Aurelien Rodriguez; Austen Gregerson; Ava Spataru; Baptiste; Roziere; Bethany Biron; Binh Tang; Bobbie Chern; Charlotte Caucheteux; Chaya; Nayak; Chloe Bi; Chris Marra; Chris McConnell; Christian Keller; Christophe; Touret; Chunyang Wu; Corinne Wong; Cristian Canton Ferrer; Cyrus Nikolaidis,; Damien Allonsius; Daniel Song; Danielle Pintz; Danny Livshits; Danny Wyatt,; David Esiobu; Dhruv Choudhary; Dhruv Mahajan; Diego Garcia-Olano; Diego; Perino; Dieuwke Hupkes; Egor Lakomkin; Ehab AlBadawy; Elina Lobanova; Emily; Dinan; Eric Michael Smith; Filip Radenovic; Francisco Guzm\'an; Frank Zhang,; Gabriel Synnaeve; Gabrielle Lee; Georgia Lewis Anderson; Govind Thattai,; Graeme Nail; Gregoire Mialon; Guan Pang; Guillem Cucurell; Hailey Nguyen,; Hannah Korevaar; Hu Xu; Hugo Touvron; Iliyan Zarov; Imanol Arrieta Ibarra,; Isabel Kloumann; Ishan Misra; Ivan Evtimov; Jack Zhang; Jade Copet; Jaewon; Lee; Jan Geffert; Jana Vranes; Jason Park; Jay Mahadeokar; Jeet Shah; Jelmer; van der Linde; Jennifer Billock; Jenny Hong; Jenya Lee; Jeremy Fu; Jianfeng; Chi; Jianyu Huang; Jiawen Liu; Jie Wang; Jiecao Yu; Joanna Bitton; Joe; Spisak; Jongsoo Park; Joseph Rocca; Joshua Johnstun; Joshua Saxe; Junteng; Jia; Kalyan Vasuden Alwala; Karthik Prasad; Kartikeya Upasani; Kate Plawiak,; Ke Li; Kenneth Heafield; Kevin Stone; Khalid El-Arini; Krithika Iyer; Kshitiz; Malik; Kuenley Chiu; Kunal Bhalla; Kushal Lakhotia; Lauren Rantala-Yeary,; Laurens van der Maaten; Lawrence Chen; Liang Tan; Liz Jenkins; Louis Martin,; Lovish Madaan; Lubo Malo; Lukas Blecher; Lukas Landzaat; Luke de Oliveira,; Madeline Muzzi; Mahesh Pasupuleti; Mannat Singh; Manohar Paluri; Marcin; Kardas; Maria Tsimpoukelli; Mathew Oldham; Mathieu Rita; Maya Pavlova,; Melanie Kambadur; Mike Lewis; Min Si; Mitesh Kumar Singh; Mona Hassan; Naman; Goyal; Narjes Torabi; Nikolay Bashlykov; Nikolay Bogoychev; Niladri; Chatterji; Ning Zhang; Olivier Duchenne; Onur \c{C}elebi; Patrick Alrassy,; Pengchuan Zhang; Pengwei Li; Petar Vasic; Peter Weng; Prajjwal Bhargava,; Pratik Dubal; Praveen Krishnan; Punit Singh Koura; Puxin Xu; Qing He,; Qingxiao Dong; Ragavan Srinivasan; Raj Ganapathy; Ramon Calderer; Ricardo; Silveira Cabral; Robert Stojnic; Roberta Raileanu; Rohan Maheswari; Rohit; Girdhar; Rohit Patel; Romain Sauvestre; Ronnie Polidoro; Roshan Sumbaly; Ross; Taylor; Ruan Silva; Rui Hou; Rui Wang; Saghar Hosseini; Sahana Chennabasappa,; Sanjay Singh; Sean Bell; Seohyun Sonia Kim; Sergey Edunov; Shaoliang Nie,; Sharan Narang; Sharath Raparthy; Sheng Shen; Shengye Wan; Shruti Bhosale,; Shun Zhang; Simon Vandenhende; Soumya Batra; Spencer Whitman; Sten Sootla,; Stephane Collot; Suchin Gururangan; Sydney Borodinsky; Tamar Herman; Tara; Fowler; Tarek Sheasha; Thomas Georgiou; Thomas Scialom; Tobias Speckbacher,; Todor Mihaylov; Tong Xiao; Ujjwal Karn; Vedanuj Goswami; Vibhor Gupta,; Vignesh Ramanathan; Viktor Kerkez; Vincent Gonguet; Virginie Do; Vish Vogeti,; V\'itor Albiero; Vladan Petrovic; Weiwei Chu; Wenhan Xiong; Wenyin Fu,; Whitney Meers; Xavier Martinet; Xiaodong Wang; Xiaofang Wang; Xiaoqing Ellen; Tan; Xide Xia; Xinfeng Xie; Xuchao Jia; Xuewei Wang; Yaelle Goldschlag,; Yashesh Gaur; Yasmine Babaei; Yi Wen; Yiwen Song; Yuchen Zhang; Yue Li,; Yuning Mao; Zacharie Delpierre Coudert; Zheng Yan; Zhengxing Chen; Zoe; Papakipos; Aaditya Singh; Aayushi Srivastava; Abha Jain; Adam Kelsey; Adam; Shajnfeld; Adithya Gangidi; Adolfo Victoria; Ahuva Goldstand; Ajay Menon,; Ajay Sharma; Alex Boesenberg; Alexei Baevski; Allie Feinstein; Amanda Kallet,; Amit Sangani; Amos Teo; Anam Yunus; Andrei Lupu; Andres Alvarado; Andrew; Caples; Andrew Gu; Andrew Ho; Andrew Poulton; Andrew Ryan; Ankit Ramchandani,; Annie Dong; Annie Franco; Anuj Goyal; Aparajita Saraf; Arkabandhu Chowdhury,; Ashley Gabriel; Ashwin Bharambe; Assaf Eisenman; Azadeh Yazdan; Beau James,; Ben Maurer; Benjamin Leonhardi; Bernie Huang; Beth Loyd; Beto De Paola,; Bhargavi Paranjape; Bing Liu; Bo Wu; Boyu Ni; Braden Hancock; Bram Wasti,; Brandon Spence; Brani Stojkovic; Brian Gamido; Britt Montalvo; Carl Parker,; Carly Burton; Catalina Mejia; Ce Liu; Changhan Wang; Changkyu Kim; Chao Zhou,; Chester Hu; Ching-Hsiang Chu; Chris Cai; Chris Tindal; Christoph; Feichtenhofer; Cynthia Gao; Damon Civin; Dana Beaty; Daniel Kreymer; Daniel; Li; David Adkins; David Xu; Davide Testuggine; Delia David; Devi Parikh,; Diana Liskovich; Didem Foss; Dingkang Wang; Duc Le; Dustin Holland; Edward; Dowling; Eissa Jamil; Elaine Montgomery; Eleonora Presani; Emily Hahn; Emily; Wood; Eric-Tuan Le; Erik Brinkman; Esteban Arcaute; Evan Dunbar; Evan; Smothers; Fei Sun; Felix Kreuk; Feng Tian; Filippos Kokkinos; Firat Ozgenel,; Francesco Caggioni; Frank Kanayet; Frank Seide; Gabriela Medina Florez,; Gabriella Schwarz; Gada Badeer; Georgia Swee; Gil Halpern; Grant Herman,; Grigory Sizov; Guangyi (Jack) Zhang; Guna Lakshminarayanan; Hakan Inan; Hamid; Shojanazeri; Han Zou; Hannah Wang; Hanwen Zha; Haroun Habeeb; Harrison; Rudolph; Helen Suk; Henry Aspegren; Hunter Goldman; Hongyuan Zhan; Ibrahim; Damlaj; Igor Molybog; Igor Tufanov; Ilias Leontiadis; Irina-Elena Veliche,; Itai Gat; Jake Weissman; James Geboski; James Kohli; Janice Lam; Japhet; Asher; Jean-Baptiste Gaya; Jeff Marcus; Jeff Tang; Jennifer Chan; Jenny Zhen,; Jeremy Reizenstein; Jeremy Teboul; Jessica Zhong; Jian Jin; Jingyi Yang; Joe; Cummings; Jon Carvill; Jon Shepard; Jonathan McPhie; Jonathan Torres; Josh; Ginsburg; Junjie Wang; Kai Wu; Kam Hou U; Karan Saxena; Kartikay Khandelwal,; Katayoun Zand; Kathy Matosich; Kaushik Veeraraghavan; Kelly Michelena; Keqian; Li; Kiran Jagadeesh; Kun Huang; Kunal Chawla; Kyle Huang; Lailin Chen,; Lakshya Garg; Lavender A; Leandro Silva; Lee Bell; Lei Zhang; Liangpeng Guo,; Licheng Yu; Liron Moshkovich; Luca Wehrstedt; Madian Khabsa; Manav Avalani,; Manish Bhatt; Martynas Mankus; Matan Hasson; Matthew Lennie; Matthias Reso,; Maxim Groshev; Maxim Naumov; Maya Lathi; Meghan Keneally; Miao Liu; Michael; L. Seltzer; Michal Valko; Michelle Restrepo; Mihir Patel; Mik Vyatskov,; Mikayel Samvelyan; Mike Clark; Mike Macey; Mike Wang; Miquel Jubert Hermoso,; Mo Metanat; Mohammad Rastegari; Munish Bansal; Nandhini Santhanam; Natascha; Parks; Natasha White; Navyata Bawa; Nayan Singhal; Nick Egebo; Nicolas; Usunier; Nikhil Mehta; Nikolay Pavlovich Laptev; Ning Dong; Norman Cheng,; Oleg Chernoguz; Olivia Hart; Omkar Salpekar; Ozlem Kalinli; Parkin Kent,; Parth Parekh; Paul Saab; Pavan Balaji; Pedro Rittner; Philip Bontrager,; Pierre Roux; Piotr Dollar; Polina Zvyagina; Prashant Ratanchandani; Pritish; Yuvraj; Qian Liang; Rachad Alao; Rachel Rodriguez; Rafi Ayub; Raghotham; Murthy; Raghu Nayani; Rahul Mitra; Rangaprabhu Parthasarathy; Raymond Li,; Rebekkah Hogan; Robin Battey; Rocky Wang; Russ Howes; Ruty Rinott; Sachin; Mehta; Sachin Siby; Sai Jayesh Bondu; Samyak Datta; Sara Chugh; Sara Hunt,; Sargun Dhillon; Sasha Sidorov; Satadru Pan; Saurabh Mahajan; Saurabh Verma,; Seiji Yamamoto; Sharadh Ramaswamy; Shaun Lindsay; Shaun Lindsay; Sheng Feng,; Shenghao Lin; Shengxin Cindy Zha; Shishir Patil; Shiva Shankar; Shuqiang; Zhang; Shuqiang Zhang; Sinong Wang; Sneha Agarwal; Soji Sajuyigbe; Soumith; Chintala; Stephanie Max; Stephen Chen; Steve Kehoe; Steve Satterfield,; Sudarshan Govindaprasad; Sumit Gupta; Summer Deng; Sungmin Cho; Sunny Virk,; Suraj Subramanian; Sy Choudhury; Sydney Goldman; Tal Remez; Tamar Glaser,; Tamara Best; Thilo Koehler; Thomas Robinson; Tianhe Li; Tianjun Zhang; Tim; Matthews; Timothy Chou; Tzook Shaked; Varun Vontimitta; Victoria Ajayi,; Victoria Montanez; Vijai Mohan; Vinay Satish Kumar; Vishal Mangla; Vlad; Ionescu; Vlad Poenaru; Vlad Tiberiu Mihailescu; Vladimir Ivanov; Wei Li,; Wenchen Wang; Wenwen Jiang; Wes Bouaziz; Will Constable; Xiaocheng Tang,; Xiaojian Wu; Xiaolan Wang; Xilun Wu; Xinbo Gao; Yaniv Kleinman; Yanjun Chen,; Ye Hu; Ye Jia; Ye Qi; Yenda Li; Yilin Zhang; Ying Zhang; Yossi Adi; Youngjin; Nam; Yu (Sid) Wang; Yu Zhao; Yuchen Hao; Yundi Qian; Yunlu Li; Yuzi He; Zach; Rait; Zachary DeVito; Zef Rosnbrick; Zhaoduo Wen; Zhenyu Yang; Zhiwei Zhao,; Zhiyu Ma

arXiv:2407.21783·cs.AI·November 26, 2024

The Llama 3 Herd of Models

Aaron Grattafiori, Abhimanyu Dubey, Abhinav Jauhri, Abhinav Pandey,, Abhishek Kadian, Ahmad Al-Dahle, Aiesha Letman, Akhil Mathur, Alan Schelten,, Alex Vaughan, Amy Yang, Angela Fan, Anirudh Goyal, Anthony Hartshorn, Aobo, Yang, Archi Mitra, Archie Sravankumar, Artem Korenev

PDF

5 Repos 10 Models 5 Datasets

TL;DR

This paper introduces Llama 3, a new family of multilingual foundation models with up to 405B parameters, supporting coding, reasoning, and tool use, and evaluates their performance across diverse tasks.

Contribution

It presents the development and extensive evaluation of Llama 3, including multimodal extensions, and releases the models for public use with safety measures.

Findings

01

Llama 3 achieves comparable quality to GPT-4 on many tasks.

02

Multimodal extensions perform competitively on image, video, and speech recognition.

03

Models are not yet broadly released due to ongoing development.

Abstract

Modern artificial intelligence (AI) systems are powered by foundation models. This paper presents a new set of foundation models, called Llama 3. It is a herd of language models that natively support multilinguality, coding, reasoning, and tool usage. Our largest model is a dense Transformer with 405B parameters and a context window of up to 128K tokens. This paper presents an extensive empirical evaluation of Llama 3. We find that Llama 3 delivers comparable quality to leading language models such as GPT-4 on a plethora of tasks. We publicly release Llama 3, including pre-trained and post-trained versions of the 405B parameter language model and our Llama Guard 3 model for input and output safety. The paper also presents the results of experiments in which we integrate image, video, and speech capabilities into Llama 3 via a compositional approach. We observe this approach performs…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

Models

Datasets

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

MethodsAttention Is All You Need · Sparse Evolutionary Training · Label Smoothing · Adam · Linear Layer · Byte Pair Encoding · Layer Normalization · Softmax · Position-Wise Feed-Forward Layer · Dense Connections