A Unified Framework for Evaluating and Enhancing the Transparency of Explainable AI Methods via Perturbation-Gradient Consensus Attribution

Md. Ariful Islam; Md Abrar Jahin; M. F. Mridha; and Nilanjan Dey

arXiv:2412.03884·cs.AI·April 10, 2026·2 cites

A Unified Framework for Evaluating and Enhancing the Transparency of Explainable AI Methods via Perturbation-Gradient Consensus Attribution

Md. Ariful Islam, Md Abrar Jahin, M. F. Mridha, and Nilanjan Dey

PDF

1 Repo

TL;DR

This paper introduces a comprehensive evaluation framework for XAI methods and proposes PGCA, a novel attribution technique that combines perturbation importance with gradient-based methods, demonstrating superior performance across multiple domains.

Contribution

The paper presents a unified multi-criteria evaluation framework and a new attribution method, PGCA, enhancing fidelity, interpretability, and fairness in explainable AI.

Findings

01

PGCA outperforms baselines in fidelity, interpretability, and fairness metrics.

02

The evaluation framework effectively ranks XAI methods across diverse domains.

03

Code and results are publicly available for reproducibility.

Abstract

Explainable Artificial Intelligence (XAI) methods are increasingly used in safety-critical domains, yet there is no unified framework to jointly evaluate fidelity, interpretability, robustness, fairness, and completeness. We address this gap through two contributions. First, we propose a multi-criteria evaluation framework that formalizes these five criteria using principled metrics: fidelity via prediction-gap analysis; interpretability via a composite concentration-coherence-contrast score; robustness via cosine-similarity perturbation stability; fairness via Jensen-Shannon divergence across demographic groups; and completeness via feature-ablation coverage. These are integrated using an entropy-weighted dynamic scoring scheme that adapts to domain-specific priorities. Second, we introduce Perturbation-Gradient Consensus Attribution (PGCA), which fuses grid-based perturbation…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

null
github

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.