Leveraging Image Editing Foundation Models for Data-Efficient CT Metal Artifact Reduction

Ahmet Rasim Emirdagi; S\"uleyman Aslan; M{\i}sra Yavuz; G\"orkay Aydemir; Yunus Bilge Kurt; Nasrin Rahimi; Burak Can Biner; M. Ak{\i}n Y{\i}lmaz

arXiv:2604.05934·cs.CV·April 8, 2026

Leveraging Image Editing Foundation Models for Data-Efficient CT Metal Artifact Reduction

Ahmet Rasim Emirdagi, S\"uleyman Aslan, M{\i}sra Yavuz, G\"orkay Aydemir, Yunus Bilge Kurt, Nasrin Rahimi, Burak Can Biner, M. Ak{\i}n Y{\i}lmaz

PDF

1 Repo

TL;DR

This paper introduces a data-efficient, foundation model-based approach for CT metal artifact reduction, leveraging visual priors and multi-reference conditioning to outperform existing methods with minimal training data.

Contribution

It adapts a general-purpose vision-language diffusion model with parameter-efficient LoRA for effective, data-efficient CT artifact reduction, emphasizing domain adaptation and multi-reference conditioning.

Findings

01

Achieves state-of-the-art performance on the AAPM CT-MAR benchmark.

02

Reduces training data requirements by two orders of magnitude.

03

Effectively mitigates hallucinations through domain adaptation.

Abstract

Metal artifacts from high-attenuation implants severely degrade CT image quality, obscuring critical anatomical structures and posing a challenge for standard deep learning methods that require extensive paired training data. We propose a paradigm shift: reframing artifact reduction as an in-context reasoning task by adapting a general-purpose vision-language diffusion foundation model via parameter-efficient Low-Rank Adaptation (LoRA). By leveraging rich visual priors, our approach achieves effective artifact suppression with only 16 to 128 paired training examples reducing data requirements by two orders of magnitude. Crucially, we demonstrate that domain adaptation is essential for hallucination mitigation; without it, foundation models interpret streak artifacts as erroneous natural objects (e.g., waffles or petri dishes). To ground the restoration, we propose a multi-reference…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

ahmetemirdagi/CT-EditMAR
github

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.