首页> 中文学位 >基于k-匿名隐私数据挖掘研究
【6h】

基于k-匿名隐私数据挖掘研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

第二章隐私保护挖掘算法综述

第三章K-匿名的分类分析

第四章相关概念以及问题的阐述

第五章利用特征分布的新型k ‐匿名法

第六章试验结果及总结

总 结

参考文献

硕士期间发表论文目录

致谢

展开▼

摘要

随着信息技术的高速发展,网络中的数据共享和交换行为出现得越来越频繁。因为数据挖掘是从原始数据中挖掘提取对人们有用的信息,因此它也被作为数据分析工具而得到了广泛应用。而于此同时数据挖掘带来的隐私保护问题也已经引起了人们的关注。在隐私保护数据挖掘中,基于K-匿名的隐私保护数据挖掘方法是一种既能达到挖掘数据信息同时又能很好的保护隐私的方法。这种方法可以在数据被挖掘前有效的保护某些敏感信息,它要求数据集中的每一个记录都与至少k-1个关于这个数据集中的准标识符属性记录相同,这样在k-匿名数据集中,个人就无法从最少k-1个个人群中被分辨出来。其中,最常见的实现k-匿名的方法就是用一个语义上一致的值来代替需要保护的敏感信息。本文提出一种不同的方法来实现数据的k-匿名化,将原始数据集划分成若干个投影,并且使每一个投影都遵循k-匿名模型。然后我们用一个分类器对每个投影进行训练,分类结果表明没有被标记的元祖都可以被分类器很好的分类。 考虑到分类器的准确性和k-匿名化的限制,本文提出的实现k-匿名化的方法采用遗传算法来寻找最佳的划分方法。为了得到该方法的分类性能,我们使用10个不同的数据集对其进行测试,并和其它主要k-匿名化方法进行比较。试验结果表明,本文提出的方法比现存的k-匿名化方法要好,并且在划分数据集时不在需要专业知识。最后采用多目标优化算法,我们对隐私保护数据挖掘的两个矛盾体——隐私保护度和挖掘准确度进行研究。

著录项

  • 作者

    郑招华;

  • 作者单位

    江苏科技大学;

  • 授予单位 江苏科技大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 苏勇;
  • 年度 2011
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 建筑设计;计算技术、计算机技术;
  • 关键词

    匿名;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号