# Development and validation of an artificial intelligence-based model for diagnosing benign, borderline, and malignant adnexal masses

**Authors:** Yingnan Wu, Wenli Dai, Xiaoying Li, Shuang Zhang, Liping Gong, Jin Wang, Ailin Cui, Songxue Li, Manning Zhu, Shuang Dong, Yaoting Wang, Lei Zhou, Dexing Kong, Jing Zhao, Litao Sun

PMC · DOI: 10.1038/s41698-026-01320-5 · 2026-02-03

## TL;DR

This paper introduces Clinical-OMTA, an AI model that helps diagnose ovarian masses and performs as well as experts, with potential benefits in low-resource settings.

## Contribution

The novel dual-backbone AI model Clinical-OMTA integrates ultrasound, age, and CA125 for classifying adnexal masses.

## Key findings

- Clinical-OMTA showed comparable performance to ADNEX and expert assessment in diagnosing adnexal masses.
- Including age and CA125 did not improve model performance over image-only models.
- The model improved radiologists' diagnostic accuracy and agreement when used as a decision support tool.

## Abstract

Classification of benign, borderline, and malignant adnexal masses is critical to effective clinical management, but remains a challenge. We developed Clinical-Ovarian Multi-Task Attention (Clinical-OMTA), an artificial intelligence model based on a dual-backbone architecture (benign vs. non-benign, and borderline vs. malignant) that integrates ultrasound, age, and Carbohydrate Antigen 125 (CA125) for multi-class classification. The model’s performance, generalisability, and clinical utility were evaluated. Retrospective data were collected from 23 hospitals (1882 patients for training, validation, and internal testing from 21 hospitals; 340 and 159 patients for external testing from two hospitals). In the external image dataset, Clinical-OMTA demonstrated comparable diagnostic performance to ADNEX (area under the receiver operating characteristic curve [AUC]: 0.950 vs. 0.953, 0.870 vs. 0.853, 0.930 vs. 0.938) and subjective assessment by an expert examiner (accuracy: 85.6% vs. 87.4%). While Clinical-OMTA supported multimodal integration, it did not outperform Ovarian Multi-Task Attention (OMTA) that trained only with images, indicating that including age and CA125 did not improve performance. Clinical-OMTA performed similarly across acquisition modes, equipment types, scanning methods, and different centres (accuracy: 79.9%–87.7%). With Clinical-OMTA as a decision support tool, radiologists showed significantly improved inter-reader agreement (kappa: 0.17–0.78 vs. 0.86–0.98) and diagnostic accuracy (72.3% vs. 88.0%). Clinical-OMTA appears generalisable and could be especially useful in low-resource or remote settings where expert ultrasound examiners are scarce.

## Full-text entities

- **Genes:** MUC16 (mucin 16, cell surface associated) [NCBI Gene 94025] {aka CA125}
- **Diseases:** adnexal masses (MESH:D000291)
- **Species:** Homo sapiens (human, species) [taxon 9606]

## Figures

3 figures with captions in the complete paper: https://tomesphere.com/paper/PMC12976284/full.md

---
Source: https://tomesphere.com/paper/PMC12976284