Using Anonymized Data for Classification

机译：使用匿名数据进行分类

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In recent years, anonymization methods have emerged as an important tool to preserve individual privacy when releasing privacy sensitive data sets. This interest in anonymization techniques has resulted in a plethora of methods for anonymizing data under different privacy and utility assumptions. At the same time, there has been little research addressing how to effectively use the anonymized data for data mining in general and for distributed data mining in particular. In this paper, we propose a new approach for building classifiers using anonymized data by modeling anonymized data as uncertain data. In our method, we do not assume any probability distribution over the data. Instead, we propose collecting all necessary statistics during anonymization and releasing these together with the anonymized data. We show that releasing such statistics does not violate anonymity. Experiments spanning various alternatives both in local and distributed data mining settings reveal that our method performs better than heuristic approaches for handling anonymized data.

机译：近年来，匿名方法已成为一种重要的工具，可以在发布隐私敏感数据集时保护个人隐私。对匿名化技术的这种兴趣导致了用于在不同的隐私和实用性假设下对数据进行匿名化的过多方法。同时，很少有研究针对如何有效地将匿名数据用于一般数据挖掘，尤其是针对分布式数据挖掘。在本文中，我们通过将匿名数据建模为不确定数据，提出了一种使用匿名数据构建分类器的新方法。在我们的方法中，我们不假定数据上的任何概率分布。相反，我们建议在匿名化过程中收集所有必要的统计信息，并将其与匿名化数据一起发布。我们表明，发布此类统计信息不会违反匿名性。在本地和分布式数据挖掘设置中跨越各种替代方案的实验表明，我们的方法比启发式方法在处理匿名数据方面表现更好。

著录项

来源
《Data Engineering, ICDE, 2009 IEEE 25th International Conference on》|2009年|P.429-440|共12页
会议地点
作者
Inan; Ali; Kantarcioglu; Murat; Bertino; Elisa;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类工业技术;
关键词

相似文献

外文文献
中文文献
专利

1. An Improved Classification Analysis on Utility Aware K-Anonymized Dataset [J] . S. Kishore Verma, A. Rajesh, J. S. Adeline Johnsana Journal of computational and theoretical nanoscience . 2019,第2期

机译：Utility Aware K-Anymymated DataSet的改进分类分析
2. An evolutionary feature set decomposition based anonymization for classification workloads: Privacy Preserving Data Mining [J] . A. K. Ilavarasi, B. Sathiyabhama Cluster computing . 2017,第4期

机译：基于进化功能集分解的分类工作负载匿名化：隐私保留数据挖掘
3. Improving accuracy of classification models induced from anonymized datasets [J] . Last M., Tassa T., Zhmudyak A., Information Sciences: An International Journal . 2014,第Null期

机译：提高匿名数据集引起的分类模型的准确性
4. Privacy and Data Mining: Evaluating the Impact of Data Anonymization on Classification Algorithms [C] . Hebert de Oliveira Silva, Tania Basso, Regina Lúcia de Oliveira Moraes European Dependable Computing Conference . 2017

机译：隐私和数据挖掘：评估数据匿名化对分类算法的影响
5. The Dark Net: De-anonymization, Classification and Analysis [D] . Portnoff, Rebecca Sorla. 2017

机译：黑暗网：解除匿名，分类和分析
6. Lost in Anonymization — A Data Anonymization Reference Classification Merging Legal and Technical Considerations [O] . Kerstin N. Vokinger, Daniel J. Stekhoven, Michael Krauthammer -1

机译：在匿名化中丢失 - 数据匿名参考分类合并法律和技术考虑
7. Using Anonymized Data for Classification [O] . Inan, Ali, Kantarcioglu, Murat, Bertino, Elisa 2009

机译：使用匿名数据进行分类

Using Anonymized Data for Classification

摘要

著录项

相似文献

相关主题

期刊订阅