首页> 中文学位 >基于数据集动态更新的隐私保护算法
【6h】

基于数据集动态更新的隐私保护算法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文主要研究内容

1.4 论文的组织结构及章节安排

第2章 相关理论与技术

2.1 匿名化隐私保护技术

2.2 不同应用场景的数据集发布技术

2.3 匿名化算法的准确度限制

2.4 隐私保护技术度量方法

2.5 本章小结

第3章 基于动态数据集更新的隐私保护算法

3.1 问题的提出

3.2 数据集动态更新的分类及相关名词的定义

3.3 基于数据集动态更新隐私保护λ-variety算法

3.4 基于数据集动态更新隐私保护(D,λ)-variety算法

3.5本章小结

第4章 仿真实验与结果分析

4.1 实验平台及数据集

4.2实验内容及方案

4.3实验结果及分析

4.4 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

伴随着互联网等各种各样通讯技术的飞速发展,使信息共享变得越来越容易。国家、企业及个人可以更加容易的搜集到自己所需的有用信息。与此同时随着数据挖掘以及数据发布的应用,隐私保护问题也越来越受到社会各界的关注。以往大多数研究都集中对静态数据集进行隐私保护方法研究,然而在实际应用中,通常发布的数据集都是随着时间变化的,因此如何对此类问题实现隐私保护是一个研究的重点。
  本文着重对具有内部敏感属性值更新的数据集隐私保护问题进行了研究,为了对具有这种更新类型的数据集进行隐私保护,本文引入了匿名化技术、桶技术,并在此基础之上提出λ-variety算法:首先,采用读取数据表的敏感属性字段类型的方法来判断属性值的更新类型;其次,对于不同类别的数据集更新,采用不同的桶创建和记录分配方法。最后,划分好等价类并进行匿名发布。此外,本文着重考虑了匿名化后数据的准确度这个因素,又提出了(D,λ)-variety算法,(D,λ)-variety算法采用了贪婪思想,其在对待发布数据集实现隐私保护的同时还保证了发布数据集的可用性。本文采用了来自于http://ipums.org网站的Income数据集和OCC数据集进行了实验,结果表明本文提出的λ-variety算法和(D,λ)-variety算法,能对具有外部更新以及具有不同类别内部属性值更新的数据集实现较好的隐私保护。另外,本文提出的(D,λ)-variety算法和本文提出的λ-variety算法相比,前者可以保证匿名化后数据集的准确度,但是前者较后者隐私保护度会有一些下降。所以,在对待发布数据集进行隐私保护时,具体采用λ-variety算法还是(D,λ)-variety算法,可以依据具体的应用目标而定。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号