首页> 中文学位 >高维数据的非显式隐私维度识别研究
【6h】

高维数据的非显式隐私维度识别研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1 研究背景和意义

1.2 国内外相关研究和综述

1.3 本文的主要研究内容

1.4 本文的组织结构

第2章 相关基础知识

2.1 隐私保护方法介绍

2.2概率分布距离计算方法介绍

2.3本章小结

第3章 非显式隐私维度查找算法

3.1 符号集合

3.2 假设及等价性证明

3.3 非显式隐私维度查找算法

3.4 本章小结

第4章 实验设计与结果分析

4.1 实验数据介绍

4.2 实验方法介绍

4.3 评价方法介绍

4.4 实验结果及分析

4.5本章小结

结论

参考文献

攻读硕士学位期间发表的论文及其他成果

声明

致谢

展开▼

摘要

数据的发布者往往拥有数据但不具备数据挖掘的能力。数据的分析者往往拥有数据挖掘的技术但苦于缺少数据。一些数据发布者担心发布没有采取任何保护措施的数据可能会导致隐私信息泄露。而采取了隐私保护的数据又可能对后期的数据挖掘过程产生不利的影响。
  为了解决这个问题,学者们提出了一些隐私保护方法,包括k-anonymity、l-diversity、t-closeness等等。这些隐私保护方法在一定程度上对数据的隐私性取得了很好的保护效果,然而这些传统的隐私保护方法都是基于预先指定的非显式隐私维度的隐私保护方法,并没有研究如何自动地选择非显式隐私维度。当数据的维度数量变得很大的时候,通过人工的分析并指定对哪些属性做保护是不现实的。这就迫切地需要一种自适应地识别非显式隐私维度的方法。
  非显式隐私维度往往在概率分布上与敏感属性具有一定的相似性。而在进行非显式隐私维度查找方面往往会遇到组合爆炸(Combinatorial Explosion)问题。为了在查找过程中对查找空间进行约减,本文在概率分布相似性基础上提出了两个假设前提,并对其等价性进行了证明。基于该假设,本文提出了一种称为IPFS(Implicit Privacy Feature Set)的算法,去发现所有可能导致属性泄露(Attribute Disclosure)的非显式隐私维度组合。这种维度组合被称为完备非显式隐私维度集合;此外,本文又提出了一种称为KIPFS(Key Implicit Privacy Feature Set)的算法,在非显式隐私维度组合的集合中识别关键的非显式隐私维度,而这些关键的非显式隐私维度的集合就是本文选择出来的将要去做隐私保护的维度集合。
  实验结果表明在该方法选择出来的维度上做隐私保护要比在预先设定的维度上能达到更好的隐私保护效果,而且最小化了隐私保护过程对数据分布的影响,从而在保护隐私的前提下保证了后期数据挖掘的质量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号