A Cross-Lingual Statutory Article Retrieval Dataset for Taiwan Legal   Studies

Yen-Hsiang Wang; Feng-Dian Su; Tzu-Yu Yeh; Yao-Chung Fan

arXiv:2410.11450·cs.CL·October 16, 2024

A Cross-Lingual Statutory Article Retrieval Dataset for Taiwan Legal Studies

Yen-Hsiang Wang, Feng-Dian Su, Tzu-Yu Yeh, Yao-Chung Fan

PDF

Open Access 1 Repo

TL;DR

This paper presents a new cross-lingual legal dataset for Taiwan, enabling better retrieval of statutes in multilingual contexts and proposing LLM-based methods to improve cross-lingual legal information access.

Contribution

It introduces a comprehensive cross-lingual legal dataset and baseline methods, addressing translation challenges in multilingual legal retrieval systems.

Findings

01

Dataset covers all Taiwanese civil, criminal, and administrative laws.

02

Proposed LLM-based methods improve cross-lingual retrieval accuracy.

03

Enhances access to legal information for non-native speakers in Taiwan.

Abstract

This paper introduces a cross-lingual statutory article retrieval (SAR) dataset designed to enhance legal information retrieval in multilingual settings. Our dataset features spoken-language-style legal inquiries in English, paired with corresponding Chinese versions and relevant statutes, covering all Taiwanese civil, criminal, and administrative laws. This dataset aims to improve access to legal information for non-native speakers, particularly for foreign nationals in Taiwan. We propose several LLM-based methods as baselines for evaluating retrieval effectiveness, focusing on mitigating translation errors and improving cross-lingual retrieval performance. Our work provides a valuable resource for developing inclusive legal information retrieval systems.

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Repositories

nchu-nlp-lab/lawfactsqa-tw
noneOfficial

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsArtificial Intelligence in Law · Computational and Text Analysis Methods