Datasheets Aren't Enough: DataRubrics for Automated Quality Metrics and Accountability

Genta Indra Winata; David Anugraha; Emmy Liu; Alham Fikri Aji; Shou-Yi Hung; Aditya Parashar; Patrick Amadeus Irawan; Ruochen Zhang; Zheng-Xin Yong; Jan Christian Blaise Cruz; Niklas Muennighoff; Seungone Kim; Hanyang Zhao; Sudipta Kar; Kezia Erina Suryoraharjo; M. Farid Adilazuarda; En-Shiun Annie Lee; Ayu Purwarianti; Derry Tanti Wijaya; Monojit Choudhury

arXiv:2506.01789·cs.LG·June 4, 2025

Datasheets Aren't Enough: DataRubrics for Automated Quality Metrics and Accountability

Genta Indra Winata, David Anugraha, Emmy Liu, Alham Fikri Aji, Shou-Yi Hung, Aditya Parashar, Patrick Amadeus Irawan, Ruochen Zhang, Zheng-Xin Yong, Jan Christian Blaise Cruz, Niklas Muennighoff, Seungone Kim, Hanyang Zhao, Sudipta Kar, Kezia Erina Suryoraharjo

PDF

Open Access 1 Repo

TL;DR

This paper introduces DataRubrics, a structured, rubric-based framework leveraging LLMs for standardized, scalable evaluation of dataset quality, addressing limitations of existing transparency tools and promoting higher standards in data-centric research.

Contribution

It proposes DataRubrics, a novel, reproducible framework for assessing dataset quality using LLMs, enhancing transparency, consistency, and scalability in dataset review processes.

Findings

01

DataRubrics enables reproducible dataset quality assessment.

02

LLM-based evaluation improves scalability and consistency.

03

Code for DataRubrics is publicly available.

Abstract

High-quality datasets are fundamental to training and evaluating machine learning models, yet their creation-especially with accurate human annotations-remains a significant challenge. Many dataset paper submissions lack originality, diversity, or rigorous quality control, and these shortcomings are often overlooked during peer review. Submissions also frequently omit essential details about dataset construction and properties. While existing tools such as datasheets aim to promote transparency, they are largely descriptive and do not provide standardized, measurable methods for evaluating data quality. Similarly, metadata requirements at conferences promote accountability but are inconsistently enforced. To address these limitations, this position paper advocates for the integration of systematic, rubric-based evaluation metrics into the dataset review process-particularly as…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

datarubrics/datarubrics
noneOfficial

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsData Quality and Management

MethodsSeventeen Ways to Call Uphold Helpline Full Guide USA 24 Hour Assistance