When Minor Edits Matter: LLM-Driven Prompt Attack for Medical VLM Robustness in Ultrasound

Yasamin Medghalchi; Milad Yazdani; Amirhossein Dabiriaghdam; Moein Heidari; Mojan Izadkhah; Zahra Kavian; Giuseppe Carenini; Lele Wang; Dena Shahriari; and Ilker Hacihaliloglu

arXiv:2603.21047·cs.CV·March 24, 2026

When Minor Edits Matter: LLM-Driven Prompt Attack for Medical VLM Robustness in Ultrasound

Yasamin Medghalchi, Milad Yazdani, Amirhossein Dabiriaghdam, Moein Heidari, Mojan Izadkhah, Zahra Kavian, Giuseppe Carenini, Lele Wang, Dena Shahriari, and Ilker Hacihaliloglu

PDF

Open Access

TL;DR

This paper reveals that medical vision-language models for ultrasound are vulnerable to small, adversarial prompt changes generated by large language models, exposing significant robustness gaps critical for safe clinical use.

Contribution

It introduces a scalable adversarial evaluation framework using LLMs to generate realistic prompt variations and systematically assesses Med-VLM robustness in ultrasound analysis.

Findings

01

Med-VLMs are highly sensitive to minor prompt variations.

02

Attacker LLM capacity influences attack success.

03

Identified consistent failure patterns across models.

Abstract

Ultrasound is widely used in clinical practice due to its portability, cost-effectiveness, safety, and real-time imaging capabilities. However, image acquisition and interpretation remain highly operator dependent, motivating the development of robust AI-assisted analysis methods. Vision-language models (VLMs) have recently demonstrated strong multimodal reasoning capabilities and competitive performance in medical image analysis, including ultrasound. However, emerging evidence highlights significant concerns about their trustworthiness. In particular, adversarial robustness is critical because Med-VLMs operate via natural-language instructions, rendering prompt formulation a realistic and practically exploitable point of vulnerability. Small variations (typos, shorthand, underspecified requests, or ambiguous wording) can meaningfully shift model outputs. We propose a scalable…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsAdversarial Robustness in Machine Learning · Artificial Intelligence in Healthcare and Education · Explainable Artificial Intelligence (XAI)