SurgBench: A Unified Large-Scale Benchmark for Surgical Video Analysis

Jianhui Wei; Zikai Xiao; Danyu Sun; Luqi Gong; Zongxin Yang; Zuozhu Liu; and Jian Wu

arXiv:2506.07603·cs.CV·June 17, 2025

SurgBench: A Unified Large-Scale Benchmark for Surgical Video Analysis

Jianhui Wei, Zikai Xiao, Danyu Sun, Luqi Gong, Zongxin Yang, Zuozhu Liu, and Jian Wu

PDF

Open Access

TL;DR

SurgBench introduces a large-scale, unified surgical video dataset and benchmark to advance foundation models for diverse intraoperative analysis tasks, addressing data scarcity and evaluation challenges.

Contribution

It provides the first comprehensive surgical video dataset and benchmark, enabling systematic pretraining and evaluation of foundation models across multiple surgical scenarios.

Findings

01

Pretraining on SurgBench-P improves model performance significantly.

02

Existing models struggle to generalize across different surgical tasks.

03

SurgBench enables better cross-domain generalization to unseen procedures.

Abstract

Surgical video understanding is pivotal for enabling automated intraoperative decision-making, skill assessment, and postoperative quality improvement. However, progress in developing surgical video foundation models (FMs) remains hindered by the scarcity of large-scale, diverse datasets for pretraining and systematic evaluation. In this paper, we introduce \textbf{SurgBench}, a unified surgical video benchmarking framework comprising a pretraining dataset, \textbf{SurgBench-P}, and an evaluation benchmark, \textbf{SurgBench-E}. SurgBench offers extensive coverage of diverse surgical scenarios, with SurgBench-P encompassing 53 million frames across 22 surgical procedures and 11 specialties, and SurgBench-E providing robust evaluation across six categories (phase classification, camera motion, tool recognition, disease diagnosis, action classification, and organ detection) spanning 72…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsDigital Imaging in Medicine