Simultaneous Discrimination Prevention and Privacy Protection in Data   Publishing and Mining

Sara Hajian

arXiv:1306.6805·cs.DB·July 1, 2013·2 cites

Simultaneous Discrimination Prevention and Privacy Protection in Data Publishing and Mining

Sara Hajian

PDF

Open Access

TL;DR

This paper introduces techniques to prevent discrimination and protect privacy simultaneously in data mining, including data sanitization and pattern sanitization methods, to ensure fair and private knowledge discovery.

Contribution

It presents novel methods for combined discrimination prevention and privacy preservation in data mining, addressing both issues during data and pattern publishing.

Findings

01

Proposed data sanitization techniques for non-discriminatory datasets

02

Developed privacy and discrimination-aware pattern sanitization methods

03

Demonstrated effectiveness in preventing discriminatory and privacy-violating inferences

Abstract

Data mining is an increasingly important technology for extracting useful knowledge hidden in large collections of data. There are, however, negative social perceptions about data mining, among which potential privacy violation and potential discrimination. Automated data collection and data mining techniques such as classification have paved the way to making automated decisions, like loan granting/denial, insurance premium computation. If the training datasets are biased in what regards discriminatory attributes like gender, race, religion, discriminatory decisions may ensue. In the first part of this thesis, we tackle discrimination prevention in data mining and propose new techniques applicable for direct or indirect discrimination prevention individually or both at the same time. We discuss how to clean training datasets and outsourced datasets in such a way that direct and/or…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsPrivacy-Preserving Technologies in Data · Privacy, Security, and Data Protection · Imbalanced Data Classification Techniques