Knowledge-enhanced Pretraining for Vision-language Pathology Foundation Model on Cancer Diagnosis

Xiao Zhou; Luoyi Sun; Dexuan He; Wenbin Guan; Ge Wang; Ruifen Wang; Lifeng Wang; Xiaojun Yuan; Xin Sun; Ya Zhang; Kun Sun; Yanfeng Wang; and Weidi Xie

arXiv:2412.13126·eess.IV·January 28, 2026

Knowledge-enhanced Pretraining for Vision-language Pathology Foundation Model on Cancer Diagnosis

Xiao Zhou, Luoyi Sun, Dexuan He, Wenbin Guan, Ge Wang, Ruifen Wang, Lifeng Wang, Xiaojun Yuan, Xin Sun, Ya Zhang, Kun Sun, Yanfeng Wang, and Weidi Xie

PDF

Open Access 2 Repos

TL;DR

This paper presents KEEP, a vision-language pathology model that integrates extensive medical knowledge graphs into pretraining, significantly improving cancer diagnosis accuracy especially for rare subtypes across multiple datasets.

Contribution

Introducing KEEP, a novel knowledge-enhanced pretraining framework that incorporates a large disease knowledge graph into vision-language models for pathology.

Findings

01

Outperforms existing models on 18 public benchmarks.

02

Achieves substantial improvements in rare cancer subtype diagnosis.

03

Effectively leverages disease ontology for semantic alignment.

Abstract

Vision-language foundation models have shown great promise in computational pathology but remain primarily data-driven, lacking explicit integration of medical knowledge. We introduce KEEP (KnowledgE-Enhanced Pathology), a foundation model that systematically incorporates disease knowledge into pretraining for cancer diagnosis. KEEP leverages a comprehensive disease knowledge graph encompassing 11,454 diseases and 139,143 attributes to reorganize millions of pathology image-text pairs into 143,000 semantically structured groups aligned with disease ontology hierarchies. This knowledge-enhanced pretraining aligns visual and textual representations within hierarchical semantic spaces, enabling deeper understanding of disease relationships and morphological patterns. Across 18 public benchmarks (over 14,000 whole-slide images) and 4 institutional rare cancer datasets (926 cases), KEEP…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsAI in cancer detection · Biomedical Text Mining and Ontologies

MethodsALIGN