TADS: Task-Aware Data Selection for Multi-Task Multimodal Pre-Training

Guanjie Cheng; Boyi Li; Lingyu Sun; Mengying Zhu; Yangyang Wu; Xinkui Zhao; Shuiguang Deng

arXiv:2602.05251·cs.LG·February 6, 2026

TADS: Task-Aware Data Selection for Multi-Task Multimodal Pre-Training

Guanjie Cheng, Boyi Li, Lingyu Sun, Mengying Zhu, Yangyang Wu, Xinkui Zhao, Shuiguang Deng

PDF

Open Access

TL;DR

TADS is a novel task-aware data selection framework for multi-task multimodal pre-training that improves data efficiency and model performance by intelligently selecting high-quality, relevant, and diverse data subsets.

Contribution

It introduces a comprehensive, learnable data selection method that integrates quality, relevance, and diversity, optimized via meta-learning for multi-task multimodal models.

Findings

01

TADS reduces data usage to 36% while outperforming baselines.

02

Achieves superior zero-shot performance on multiple benchmarks.

03

Enhances data efficiency and model generalization.

Abstract

Large-scale multimodal pre-trained models like CLIP rely heavily on high-quality training data, yet raw web-crawled datasets are often noisy, misaligned, and redundant, leading to inefficient training and suboptimal generalization. Existing data selection methods are either heuristic-based, suffering from bias and limited diversity, or data-driven but task-agnostic, failing to optimize for multi-task scenarios. To address these gaps, we introduce TADS (Task-Aware Data Selection), a novel framework for multi-task multimodal pre-training that integrates Intrinsic Quality, Task Relevance, and Distributional Diversity into a learnable value function. TADS employs a comprehensive quality assessment system with unimodal and cross-modal operators, quantifies task relevance via interpretable similarity vectors, and optimizes diversity through cluster-based weighting. A feedback-driven…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsDomain Adaptation and Few-Shot Learning · Advanced Neural Network Applications · Multimodal Machine Learning Applications