Immiscible Diffusion: Accelerating Diffusion Training with Noise   Assignment

Yiheng Li; Heyang Jiang; Akio Kodaira; Masayoshi Tomizuka; Kurt; Keutzer; Chenfeng Xu

arXiv:2406.12303·cs.CV·November 1, 2024

Immiscible Diffusion: Accelerating Diffusion Training with Noise Assignment

Yiheng Li, Heyang Jiang, Akio Kodaira, Masayoshi Tomizuka, Kurt, Keutzer, Chenfeng Xu

PDF

Open Access 2 Repos 1 Models

TL;DR

This paper introduces Immiscible Diffusion, a novel training strategy inspired by physics, that improves noise-data mapping in diffusion models, leading to significantly faster training and better fidelity.

Contribution

We propose a simple assignment-then-diffusion method that restricts noise mixing, inspired by immiscibility in physics, to accelerate diffusion training.

Findings

01

Achieves up to 3x faster training on multiple datasets.

02

Improves fidelity of diffusion models.

03

Applicable to various diffusion-based tasks.

Abstract

In this paper, we point out that suboptimal noise-data mapping leads to slow training of diffusion models. During diffusion training, current methods diffuse each image across the entire noise space, resulting in a mixture of all images at every point in the noise layer. We emphasize that this random mixture of noise-data mapping complicates the optimization of the denoising function in diffusion models. Drawing inspiration from the immiscibility phenomenon in physics, we propose Immiscible Diffusion, a simple and effective method to improve the random mixture of noise-data mapping. In physics, miscibility can vary according to various intermolecular forces. Thus, immiscibility means that the mixing of molecular sources is distinguishable. Inspired by this concept, we propose an assignment-then-diffusion training strategy to achieve Immiscible Diffusion. As one example, prior to…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

Models

🤗
Mitsua/mitsua-likes
model· ♡ 29
♡ 29

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsNeural Networks and Applications

MethodsConsistency Models · SPEED: Separable Pyramidal Pooling EncodEr-Decoder for Real-Time Monocular Depth Estimation on Low-Resource Settings · Diffusion