Imagen 3

Imagen-Team-Google: Jason Baldridge; Jakob Bauer; Mukul Bhutani,; Nicole Brichtova; Andrew Bunner; Lluis Castrejon; Kelvin Chan; Yichang Chen,; Sander Dieleman; Yuqing Du; Zach Eaton-Rosen; Hongliang Fei; Nando de; Freitas; Yilin Gao; Evgeny Gladchenko; Sergio G\'omez Colmenarejo; Mandy Guo,; Alex Haig; Will Hawkins; Hexiang Hu; Huilian Huang; Tobenna Peter Igwe,; Christos Kaplanis; Siavash Khodadadeh; Yelin Kim; Ksenia Konyushkova; Karol; Langner; Eric Lau; Rory Lawton; Shixin Luo; So\v{n}a Mokr\'a; Henna Nandwani,; Yasumasa Onoe; A\"aron van den Oord; Zarana Parekh; Jordi Pont-Tuset; Hang; Qi; Rui Qian; Deepak Ramachandran; Poorva Rane; Abdullah Rashwan; Ali Razavi,; Robert Riachi; Hansa Srinivasan; Srivatsan Srinivasan; Robin Strudel; Benigno; Uria; Oliver Wang; Su Wang; Austin Waters; Chris Wolff; Auriel Wright,; Zhisheng Xiao; Hao Xiong; Keyang Xu; Marc van Zee; Junlin Zhang; Katie Zhang,; Wenlei Zhou; Konrad Zolna; Ola Aboubakar; Canfer Akbulut; Oscar Akerlund,; Isabela Albuquerque; Nina Anderson; Marco Andreetto; Lora Aroyo; Ben Bariach,; David Barker; Sherry Ben; Dana Berman; Courtney Biles; Irina Blok; Pankil; Botadra; Jenny Brennan; Karla Brown; John Buckley; Rudy Bunel; Elie; Bursztein; Christina Butterfield; Ben Caine; Viral Carpenter; Norman; Casagrande; Ming-Wei Chang; Solomon Chang; Shamik Chaudhuri; Tony Chen; John; Choi; Dmitry Churbanau; Nathan Clement; Matan Cohen; Forrester Cole; Mikhail; Dektiarev; Vincent Du; Praneet Dutta; Tom Eccles; Ndidi Elue; Ashley Feden,; Shlomi Fruchter; Frankie Garcia; Roopal Garg; Weina Ge; Ahmed Ghazy; Bryant; Gipson; Andrew Goodman; Dawid G\'orny; Sven Gowal; Khyatti Gupta; Yoni; Halpern; Yena Han; Susan Hao; Jamie Hayes; Jonathan Heek; Amir Hertz; Ed; Hirst; Emiel Hoogeboom; Tingbo Hou; Heidi Howard; Mohamed Ibrahim; Dirichi; Ike-Njoku; Joana Iljazi; Vlad Ionescu; William Isaac; Reena Jana; Gemma; Jennings; Donovon Jenson; Xuhui Jia; Kerry Jones; Xiaoen Ju; Ivana Kajic,; Christos Kaplanis; Burcu Karagol Ayan; Jacob Kelly; Suraj Kothawade,; Christina Kouridi; Ira Ktena; Jolanda Kumakaw; Dana Kurniawan; Dmitry Lagun,; Lily Lavitas; Jason Lee; Tao Li; Marco Liang; Maggie Li-Calis; Yuchi Liu,; Javier Lopez Alberca; Matthieu Kim Lorrain; Peggy Lu; Kristian Lum; Yukun Ma,; Chase Malik; John Mellor; Thomas Mensink; Inbar Mosseri; Tom Murray; Aida; Nematzadeh; Paul Nicholas; Signe N{\o}rly; Jo\~ao Gabriel Oliveira; Guillermo; Ortiz-Jimenez; Michela Paganini; Tom Le Paine; Roni Paiss; Alicia Parrish,; Anne Peckham; Vikas Peswani; Igor Petrovski; Tobias Pfaff; Alex Pirozhenko,; Ryan Poplin; Utsav Prabhu; Yuan Qi; Matthew Rahtz; Cyrus Rashtchian; Charvi; Rastogi; Amit Raul; Ali Razavi; Sylvestre-Alvise Rebuffi; Susanna Ricco,; Felix Riedel; Dirk Robinson; Pankaj Rohatgi; Bill Rosgen; Sarah Rumbley,; Moonkyung Ryu; Anthony Salgado; Tim Salimans; Sahil Singla; Florian Schroff,; Candice Schumann; Tanmay Shah; Eleni Shaw; Gregory Shaw; Brendan; Shillingford; Kaushik Shivakumar; Dennis Shtatnov; Zach Singer; Evgeny; Sluzhaev; Valerii Sokolov; Thibault Sottiaux; Florian Stimberg; Brad Stone,; David Stutz; Yu-Chuan Su; Eric Tabellion; Shuai Tang; David Tao; Kurt Thomas,; Gregory Thornton; Andeep Toor; Cristian Udrescu; Aayush Upadhyay; Cristina; Vasconcelos; Alex Vasiloff; Andrey Voynov; Amanda Walker; Luyu Wang; Miaosen; Wang; Simon Wang; Stanley Wang; Qifei Wang; Yuxiao Wang; \'Agoston Weisz,; Olivia Wiles; Chenxia Wu; Xingyu Federico Xu; Andrew Xue; Jianbo Yang; Luo; Yu; Mete Yurtoglu; Ali Zand; Han Zhang; Jiageng Zhang; Catherine Zhao; Adilet; Zhaxybay; Miao Zhou; Shengqi Zhu; Zhenkai Zhu; Dawn Bloxwich; Mahyar Bordbar,; Luis C. Cobo; Eli Collins; Shengyang Dai; Tulsee Doshi; Anca Dragan; Douglas; Eck; Demis Hassabis; Sissie Hsiao; Tom Hume; Koray Kavukcuoglu; Helen King,; Jack Krawczyk; Yeqing Li; Kathy Meier-Hellstern; Andras Orban; Yury Pinsky,; Amar Subramanya; Oriol Vinyals; Ting Yu; Yori Zwols

arXiv:2408.07009·cs.CV·December 24, 2024·3 cites

Imagen 3

Imagen-Team-Google: Jason Baldridge, Jakob Bauer, Mukul Bhutani,, Nicole Brichtova, Andrew Bunner, Lluis Castrejon, Kelvin Chan, Yichang Chen,, Sander Dieleman, Yuqing Du, Zach Eaton-Rosen, Hongliang Fei, Nando de, Freitas, Yilin Gao, Evgeny Gladchenko

PDF

Open Access 2 Repos 1 Datasets

TL;DR

Imagen 3 is a high-quality text-to-image diffusion model that outperforms existing models and incorporates safety and ethical considerations in its design.

Contribution

We present Imagen 3, a novel latent diffusion model that achieves superior image quality and addresses safety and bias issues in text-to-image generation.

Findings

01

Imagen 3 outperforms SOTA models in quality evaluations

02

Our safety assessments show reduced potential harm

03

The model demonstrates strong alignment with text prompts

Abstract

We introduce Imagen 3, a latent diffusion model that generates high quality images from text prompts. We describe our quality and responsibility evaluations. Imagen 3 is preferred over other state-of-the-art (SOTA) models at the time of evaluation. In addition, we discuss issues around safety and representation, as well as methods we used to minimize the potential harm of our models.

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

Datasets

BaiqiL/GenAI-Bench
dataset· 420 dl
420 dl

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsRadiomics and Machine Learning in Medical Imaging

MethodsLatent Diffusion Model · Diffusion