Neural Network Pruning via QUBO Optimization

Osama Orabi; Artur Zagitov; Hadi Salloum; Viktor A. Lobachev; Kasymkhan Khubiev; Yaroslav Kholodov

arXiv:2604.05856·cs.CV·April 8, 2026

Neural Network Pruning via QUBO Optimization

Osama Orabi, Artur Zagitov, Hadi Salloum, Viktor A. Lobachev, Kasymkhan Khubiev, Yaroslav Kholodov

PDF

TL;DR

This paper introduces a Hybrid QUBO framework for neural network pruning that combines importance metrics and redundancy measures, leading to improved compression performance over traditional methods.

Contribution

It presents a unified optimization approach integrating gradient-based importance and activation similarity, with a dynamic sparsity enforcement and a TT refinement stage.

Findings

01

Hybrid QUBO outperforms greedy Taylor pruning.

02

Data-driven activation similarity improves pruning quality.

03

TT Refinement enhances results at various scales.

Abstract

Neural network pruning can be formulated as a combinatorial optimization problem, yet most existing approaches rely on greedy heuristics that ignore complex interactions between filters. Formal optimization methods such as Quadratic Unconstrained Binary Optimization (QUBO) provide a principled alternative but have so far underperformed due to oversimplified objective formulations based on metrics like the L1-norm. In this work, we propose a unified Hybrid QUBO framework that bridges heuristic importance estimation with global combinatorial optimization. Our formulation integrates gradient-aware sensitivity metrics - specifically first-order Taylor and second-order Fisher information - into the linear term, while utilizing data-driven activation similarity in the quadratic term. This allows the QUBO objective to jointly capture individual filter relevance and inter-filter functional…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.