首页> 中文学位 >面向聚类的多敏感属性数据发布隐私保护研究
【6h】

面向聚类的多敏感属性数据发布隐私保护研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1课题研究背景及意义

1.2国内外研究现状

1.3本文的主要工作

1.4论文结构

第二章 相关研究

2.1隐私保护数据发布简述

2.2匿名隐私保护模型

2.3匿名化技术

2.4多敏感属性隐私保护

2.5发布数据质量度量

2.6本章小结

第三章 多维数值敏感属性数据发布个性化保护隐私算法

3.1导言

3.2相关研究基础

3.3基于聚类和加权多维桶分组的个性化数据发布算法

3.4本章小结

第四章 基于个性化加权选择度的匿名算法

4.1导言

4.2相关研究基础

4.3基于个性化加权选择度的匿名算法

4.4本章小结

第五章 仿真实验与对比分析

5.1实验准备

5.2多维数值敏感属性数据发布个性化保护隐私算法分析

5.3基于个性化加权选择度的匿名算法分析

5.4本章小结

第六章 总结与展望

6.1总结

6.2展望

参考文献

致谢

展开▼

摘要

数据发布在数据管理、数据挖掘和信息共享应用中有着重要的地位。高速发展的互联网使得海量数据的收集、发布及分析更加便捷,但与此同时,也给用户个人隐私带来了威胁。在现实生活中,有很多机构需要定期对外发布数据。例如,医院定期发布医疗统计数据,上市公司定期发布的财务报表,等等。这些数据中存在大量的个人敏感信息,如果泄露将会造成不可估量的损失。实际场景中,数据中存在不止一个敏感属性,所以,我们对数据发布中存在不止一个敏感属性的隐私研究迫在眉睫,尤其是对多敏感属性数据发布中的多维数值敏感属性个性化隐私保护问题,更是探讨热点,分析这一问题通常需要采用聚类的方法处理数据,所以称之为面向聚类。
  首先,论文分析了现有数据发布中保护隐私的各种方法,包括匿名隐私保护模型、匿名技术、应用聚类的匿名方法等等,从中得出不同匿名模型和匿名技术的优缺点。
  其次,论文对数据发布中多敏感属性的隐私保护技术进行深入探讨,指出传统的多敏感属性数据发布方法在保护隐私上存在不足。针对多维数值敏感属性数据发布隐私保护方法中,很少考虑数值敏感属性的属性值权重的个性化隐私问题。提出基于聚类和加权多维桶分组的个性化隐私保护方法。该方法首先通过聚类单独将各维数值敏感属性的属性值划分到多个聚簇中,然后为多维数值敏感属性构建加权多维桶,将表中数据记录映射到对应多维桶中,通过考虑加权选择度的最大维容量优先算法,选择多维桶中的数据记录,构建满足l-diversity的分组,最后将得到分组的准标识符进行泛化,将分组以匿名表形式发布。实验结果表明,发布的匿名数据表,满足l-diversity的同时,避免了相似性攻击,具有较低信息损失和较低的隐匿率,以及较高的数据拥有者定义重要记录可发布性,达到个性化隐私保护效果。
  最后论文对多敏感属性数据发布中的多维数值敏感属性数据发布个性化匿名技术进行深入探讨,针对传统方法中,很少同时考虑数值敏感属性的权重和敏感值的权重的问题。提出了一种基于聚类和个性化加权(数据记录权重)选择度的匿名算法,该方法利用最小个性化数据记录选择度优先的思想,选择数据记录构成满足l-diversity的分组,最后将得到分组的准标识符进行泛化,将分组以匿名表形式发布,达到个性化隐私保护。实验结果证明,此方法在保证数据隐私和个人或者数据拥有者隐私需求的同时,也具有较高的数据发布质量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号