GenderBias-\emph{VL}: Benchmarking Gender Bias in Vision Language Models   via Counterfactual Probing

Yisong Xiao; Aishan Liu; QianJia Cheng; Zhenfei Yin; Siyuan Liang,; Jiapeng Li; Jing Shao; Xianglong Liu; Dacheng Tao

arXiv:2407.00600·cs.CV·July 2, 2024

GenderBias-\emph{VL}: Benchmarking Gender Bias in Vision Language Models via Counterfactual Probing

Yisong Xiao, Aishan Liu, QianJia Cheng, Zhenfei Yin, Siyuan Liang,, Jiapeng Li, Jing Shao, Xianglong Liu, Dacheng Tao

PDF

Open Access

TL;DR

This paper introduces the GenderBias-VL benchmark, a large-scale dataset of visual question counterfactuals designed to evaluate occupation-related gender bias in vision-language models through individual fairness analysis.

Contribution

It presents the first benchmark for individual fairness in gender bias evaluation of LVLMs, using counterfactual visual questions generated via diffusion models and semantic occupation pairs.

Findings

01

Widespread gender biases found in 15 LVLMs and commercial APIs

02

Benchmark includes 34,581 visual question counterfactual pairs across 177 occupations

03

Provides a comprehensive dataset and leaderboard for bias evaluation

Abstract

Large Vision-Language Models (LVLMs) have been widely adopted in various applications; however, they exhibit significant gender biases. Existing benchmarks primarily evaluate gender bias at the demographic group level, neglecting individual fairness, which emphasizes equal treatment of similar individuals. This research gap limits the detection of discriminatory behaviors, as individual fairness offers a more granular examination of biases that group fairness may overlook. For the first time, this paper introduces the GenderBias-\emph{VL} benchmark to evaluate occupation-related gender bias in LVLMs using counterfactual visual questions under individual fairness criteria. To construct this benchmark, we first utilize text-to-image diffusion models to generate occupation images and their gender counterfactuals. Subsequently, we generate corresponding textual occupation options by…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsNatural Language Processing Techniques · Text Readability and Simplification · Multimodal Machine Learning Applications

MethodsDiffusion · Counterfactuals Explanations