Multiple Importance Sampling for Stochastic Gradient Estimation

Corentin Sala\"un; Xingchang Huang; Iliyan Georgiev; Niloy J. Mitra,; Gurprit Singh

arXiv:2407.15525·cs.LG·January 29, 2025

Multiple Importance Sampling for Stochastic Gradient Estimation

Corentin Sala\"un, Xingchang Huang, Iliyan Georgiev, Niloy J. Mitra,, Gurprit Singh

PDF

Open Access

TL;DR

This paper presents a novel importance sampling framework for stochastic gradient estimation that adaptively combines multiple distributions to improve training efficiency and convergence across diverse tasks.

Contribution

It introduces a self-adaptive, multi-distribution importance sampling method for gradient estimation, enhancing convergence speed and accuracy in training deep models.

Findings

01

Improved gradient estimates lead to faster training convergence.

02

Effective across classification, regression, image, and point cloud tasks.

03

Outperforms traditional sampling methods in empirical evaluations.

Abstract

We introduce a theoretical and practical framework for efficient importance sampling of mini-batch samples for gradient estimation from single and multiple probability distributions. To handle noisy gradients, our framework dynamically evolves the importance distribution during training by utilizing a self-adaptive metric. Our framework combines multiple, diverse sampling distributions, each tailored to specific parameter gradients. This approach facilitates the importance sampling of vector-valued gradient estimation. Rather than naively combining multiple distributions, our framework involves optimally weighting data contribution across multiple distributions. This adapted combination of multiple importance yields superior gradient estimates, leading to faster training convergence. We demonstrate the effectiveness of our approach through empirical evaluations across a range of…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsGroundwater flow and contamination studies · Target Tracking and Data Fusion in Sensor Networks · Markov Chains and Monte Carlo Methods