SEDA: A Self-Adapted Entity-Centric Data Augmentation for Boosting Gird-based Discontinuous NER Models

Wen-Fang Su; Hsiao-Wei Chou; and Wen-Yang Lin

arXiv:2511.20143·cs.CL·January 1, 2026

SEDA: A Self-Adapted Entity-Centric Data Augmentation for Boosting Gird-based Discontinuous NER Models

Wen-Fang Su, Hsiao-Wei Chou, and Wen-Yang Lin

PDF

Open Access

TL;DR

This paper introduces SEDA, a self-adapted data augmentation method for grid-based models that significantly improves the recognition of discontinuous entities in NER tasks, especially across sentence boundaries.

Contribution

We propose a novel self-adapted entity-centric data augmentation technique that enhances grid-based discontinuous NER models by addressing segmentation and omission issues.

Findings

01

F1 score improved by 1-2.5% overall

02

Discontinuous entity recognition improved by 3.7-8.4%

03

Effective on multiple datasets (CADEC, ShARe13, ShARe14)

Abstract

Named Entity Recognition (NER) is a critical task in natural language processing, yet it remains particularly challenging for discontinuous entities. The primary difficulty lies in text segmentation, as traditional methods often missegment or entirely miss cross-sentence discontinuous entities, significantly affecting recognition accuracy. Therefore, we aim to address the segmentation and omission issues associated with such entities. Recent studies have shown that grid-tagging methods are effective for information extraction due to their flexible tagging schemes and robust architectures. Building on this, we integrate image data augmentation techniques, such as cropping, scaling, and padding, into grid-based models to enhance their ability to recognize discontinuous entities and handle segmentation challenges. Experimental results demonstrate that traditional segmentation methods often…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsTopic Modeling · Natural Language Processing Techniques · Text and Document Classification Technologies