Enhancing Diagnostic Accuracy in Rare and Common Fundus Diseases with a   Knowledge-Rich Vision-Language Model

Meng Wang; Tian Lin; Aidi Lin; Kai Yu; Yuanyuan Peng; Lianyu Wang,; Cheng Chen; Ke Zou; Huiyu Liang; Man Chen; Xue Yao; Meiqin Zhang; Binwei; Huang; Chaoxin Zheng; Peixin Zhang; Wei Chen; Yilong Luo; Yifan Chen; Honghe; Xia; Tingkun Shi; Qi Zhang; Jinming Guo; Xiaolin Chen; Jingcheng Wang; Yih; Chung Tham; Dianbo Liu; Wendy Wong; Sahil Thakur; Beau Fenner; Danqi Fang,; Siying Liu; Qingyun Liu; Yuqiang Huang; Hongqiang Zeng; Yanda Meng; Yukun; Zhou; Zehua Jiang; Minghui Qiu; Changqing Zhang; Xinjian Chen; Sophia Y.; Wang; Cecilia S. Lee; Lucia Sobrin; Carol Y Cheung; Chi Pui Pang; Pearse A.; Keane; Ching-Yu Cheng; Haoyu Chen; Huazhu Fu

arXiv:2406.09317·eess.IV·April 22, 2025·1 cites

Enhancing Diagnostic Accuracy in Rare and Common Fundus Diseases with a Knowledge-Rich Vision-Language Model

Meng Wang, Tian Lin, Aidi Lin, Kai Yu, Yuanyuan Peng, Lianyu Wang,, Cheng Chen, Ke Zou, Huiyu Liang, Man Chen, Xue Yao, Meiqin Zhang, Binwei, Huang, Chaoxin Zheng, Peixin Zhang, Wei Chen, Yilong Luo, Yifan Chen, Honghe, Xia, Tingkun Shi, Qi Zhang, Jinming Guo, Xiaolin Chen

PDF

Open Access 1 Repo

TL;DR

This paper introduces RetiZero, a knowledge-rich vision-language model trained on over 340,000 fundus images and texts, significantly improving disease recognition, retrieval, and clinical diagnosis, especially for rare diseases.

Contribution

The paper presents RetiZero, a novel foundation model leveraging extensive disease knowledge and diverse data to enhance fundus disease diagnosis and retrieval tasks.

Findings

01

Achieves high zero-shot Top-5 accuracy for multiple disease sets

02

Surpasses ophthalmologists in AI-assisted clinical diagnosis

03

Improves clinicians' accuracy, especially for rare fundus diseases

Abstract

Previous foundation models for fundus images were pre-trained with limited disease categories and knowledge base. Here we introduce a knowledge-rich vision-language model (RetiZero) that leverages knowledge from more than 400 fundus diseases. For RetiZero's pretraining, we compiled 341,896 fundus images paired with texts, sourced from public datasets, ophthalmic literature, and online resources, encompassing a diverse range of diseases across multiple ethnicities and countries. RetiZero exhibits remarkable performance in several downstream tasks, including zero-shot disease recognition, image-to-image retrieval, AI-assisted clinical diagnosis,few-shot fine-tuning, and internal- and cross-domain disease identification. In zero-shot scenarios, RetiZero achieves Top-5 accuracies of 0.843 for 15 diseases and 0.756 for 52 diseases. For image retrieval, it achieves Top-5 scores of 0.950 and…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

LooKing9218/RetiZero
pytorchOfficial

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsRetinal Imaging and Analysis · Retinal and Optic Conditions