Open-H-Embodiment: A Large-Scale Dataset for Enabling Foundation Models in Medical Robotics

Open-H-Embodiment Consortium: Nigel Nelson; Juo-Tung Chen; Jesse Haworth; Xinhao Chen; Lukas Zbinden; Dianye Huang; Alaa Eldin Abdelaal; Alberto Arezzo; Ayberk Acar; Farshid Alambeigi; Carlo Alberto Ammirati; Yunke Ao; Pablo David Aranda Rodriguez; Soofiyan Atar; Mattia Ballo; Noah Barnes; Federica Barontini; Filip Binkiewicz; Peter Black; Sebastian Bodenstedt; Leonardo Borgioli; Nikola Budjak; Benjamin Calm\'e; Fabio Carrillo; Nicola Cavalcanti; Changwei Chen; Haoxin Chen; Sihang Chen; Qihan Chen; Zhongyu Chen; Ziyang Chen; Shing Shin Cheng; Meiqing Cheng; Min Cheng; Zih-Yun Sarah Chiu; Xiangyu Chu; Camilo Correa-Gallego; Giulio Dagnino; Anton Deguet; Jacob Delgado; Jonathan C. DeLong; Kaizhong Deng; Alexander Dimitrakakis; Qingpeng Ding; Hao Ding; Giovanni Distefano; Daniel Donoho; Anqing Duan; Marco Esposito; Shane Farritor; Jad Fayad; Zahi Fayad; Mario Ferradosa; Filippo Filicori; Chelsea Finn; Philipp F\"urnstahl; Jiawei Ge; Stamatia Giannarou; Xavier Giralt Ludevid; Frederic Giraud; Aditya Amit Godbole; Ken Goldberg; Antony Goldenberg; Diego Granero Marana; Xiaoqing Guo; Tam\'as Haidegger; Evan Hailey; Pascal Hansen; Ziyi Hao; Kush Hari; Kengo Hayashi; Jonathon Hawkins; Shelby Haworth; Ortrun Hellig; S. Duke Herrell; Zhouyang Hong; Andrew Howe; Junlei Hu; Zhaoyang Jacopo Hu; Ria Jain; Mohammad Rafiee Javazm; Howard Ji; Rui Ji; Jianmin Ji; Zhongliang Jiang; Dominic Jones; Jeffrey Jopling; Britton Jordan; Ran Ju; Michael Kam; Luoyao Kang; Fausto Kang; Siddhartha Kapuria; Peter Kazanzides; Sonika Kiehler; Ethan Kilmer; Ji Woong Kim; Przemys{\l}aw Korzeniowski; Chandra Kuchi; Nithesh Kumar; Alan Kuntz; Federico Lavagno; Yu Chung Lee; Hao-Chih Lee; Hang Li; Zhen Li; Xiao Liang; Xinxin Lin; Jinsong Lin; Chang Liu; Fei Liu; Pei Liu; Yun-hui Liu; Wanli Liuchen; Eszter Luk\'acs; Sareena Mann; Miles Mannas; Brett Marinelli; Sabina Martyniak; Francesco Marzola; Lorenzo Mazza; Xueyan Mei; Maria Clara Morais; Luigi Muratore; Chetan Reddy Narayanaswamy; Micha{\l} Naskr\k{e}t; David Navarro-Alarcon; Cyrus Neary; Chi Kit Ng; Christopher Nguan; David Noonan; Ki Hwan Oh; Tom Christian Olesch; Allison M. Okamura; Justin Opfermann; Matteo Pescio; Doan Xuan Viet Pham; Tito Porras; Hongliang Ren; Ariel Rodriguez Jimenez; Ferdinando Rodriguez y Baena; Septimiu E. Salcudean; Asmitha Sathya; Preethi Satish; Lalithkumar Seenivasan; Jiaqi Shao; Yiqing Shen; Yu Sheng; Lucy XiaoYang Shi; Zoe Soul\'e; Stefanie Speidel; Mingwu Su; Jianhao Su; Idris Sunmola; Krist\'of Tak\'acs; Yunxi Tang; Patrick Thornycroft; Yu Tian; Jordan Thompson; Mehmet K. Turkcan; Mathias Unberath; Pietro Valdastri; Carlos Vives; Quan Vuong; Martin Wagner; Farong Wang; Wei Wang; Lidian Wang; Chung-Pang Wang; Guankun Wang; Junyi Wang; Erqi Wang; Ziyi Wang; Tanner Watts; Wolfgang Wein; Yimeng Wu; Zijian Wu; Hongjun Wu; Luohong Wu; Jie Ying Wu; Junlin Wu; Victoria Wu; Kaixuan Wu; Mateusz W\'ojcikowski; Yunye Xiao; Nan Xiao; Wenxuan Xie; Hao Yang; Tianqi Yang; Yinuo Yang; Menglong Ye; Ryan S. Yeung; Nural Yilmaz; Chim Ho Yin; Michael Yip; Rayan Younis; Chenhao Yu; Sayem Nazmuz Zaman; Milos Zefran; Han Zhang; Yuelin Zhang; Yidong Zhang; Yanyong Zhang; Xuyang Zhang; Yameng Zhang; Joyce Zhang; Ning Zhong; Peng Zhou; Haoying Zhou; Xiuli Zuo; Nassir Navab; Mahdi Azizian; Sean D. Huver; Axel Krieger

arXiv:2604.21017·cs.RO·April 30, 2026

Open-H-Embodiment: A Large-Scale Dataset for Enabling Foundation Models in Medical Robotics

Open-H-Embodiment Consortium: Nigel Nelson, Juo-Tung Chen, Jesse Haworth, Xinhao Chen, Lukas Zbinden, Dianye Huang, Alaa Eldin Abdelaal, Alberto Arezzo, Ayberk Acar, Farshid Alambeigi, Carlo Alberto Ammirati, Yunke Ao, Pablo David Aranda Rodriguez, Soofiyan Atar, Mattia Ballo

PDF

TL;DR

This paper introduces Open-H-Embodiment, the largest open dataset of medical robotic videos with synchronized kinematics, enabling the development of foundation models for medical robotics.

Contribution

It provides a large-scale, multi-embodiment dataset and demonstrates two novel foundation models for vision-language-action and world modeling in medical robotics.

Findings

01

GR00T-H achieved 25% success on suturing benchmark, outperforming others.

02

Cosmos-H-Surgical-Simulator enables multi-embodiment surgical simulation from a single checkpoint.

03

The dataset spans over 49 institutions and multiple robotic platforms.

Abstract

Autonomous medical robots hold promise to improve patient outcomes, reduce provider workload, democratize access to care, and enable superhuman precision. However, autonomous medical robotics has been limited by a fundamental data problem: existing medical robotic datasets are small, single-embodiment, and rarely shared openly, restricting the development of foundation models that the field needs to advance. We introduce Open-H-Embodiment, the largest open dataset of medical robotic video with synchronized kinematics to date, spanning more than 49 institutions and multiple robotic platforms including the CMR Versius, Intuitive Surgical's da Vinci, da Vinci Research Kit (dVRK), Rob Surgical BiTrack, Virtual Incision's MIRA, Moon Surgical Maestro, and a variety of custom systems, spanning surgical manipulation, robotic ultrasound, and endoscopy procedures. We demonstrate the research…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.