首页> 中文学位 >基于敏感度分级量化的微数据匿名模型研究
【6h】

基于敏感度分级量化的微数据匿名模型研究

代理获取

目录

第一个书签之前

展开▼

摘要

随着云计算和大数据技术的发展,科学研究和决策对开放数据的需求日益增大,由于数据集中往往包含个人不愿透露的敏感信息,使得隐私保护问题日益突出,成为了阻碍大数据发展的一个关键性问题。为保护所发布数据集中个体的隐私,计算机科学领域的研究者开展了对数据匿名化技术的研究。通常,数据匿名化技术首先设定一个匿名模型,接着通过泛化、抑制等手段对原始数据集进行匿名化处理,最后得到满足匿名模型的结果数据集。其中,匿名模型对数据集的特征进行了约束,其主要参数直接或间接地对隐私披露风险进行了限制。 针对大数据时代的隐私保护问题,提出一种改进的匿名模型(w,l,k)-anonymity。首先分析了现有匿名模型的缺陷,如k-anonymity没有对敏感属性进行约束,因此无法抵御属性链接攻击。l-diversity与t-closeness均未考虑相同敏感属性中不同敏感属性值的敏感程度差异,对不同敏感程度的属性值进行了相同程度的保护,间接地增加了匿名数据集的敏感属性披露风险和数据效用损失。接着针对基于敏感度分级的匿名模型,总结了p+-sensitive k-anonymity与(p,α)-sensitive k-anonymity在实现机理上的不足,如p+-sensitive k-anonymity基于属性值的敏感度分级,保证了等价类中敏感属性值所属敏感级别的多样性,但是无法避免高敏感度属性值在等价类中的聚集现象。(p,α)-sensitive k-anonymity基于敏感度分级实现了敏感度权重的量化,但是其敏感度量化方式的合理性不足,无法限制等价类的整体敏感度,且不支持对数值型敏感属性值的敏感度量化等。然后针对(p,α)-sensitive k-anonymity的缺陷给出了改进方案,并在此基础上提出一种改进的基于敏感度分级量化的匿名模型。针对(p,α)-sensitive k-anonymity在量化敏感度权重方面合理性不足的问题,通过改进分级敏感度权重分配方法,引入了频率敏感度分量并与分级敏感度进行加权,优化了敏感度权重的量化机制;针对等价类元组个数差异对敏感度权重影响较大的问题,通过计算等价类的平均敏感度,限制了等价类的整体敏感度;针对敏感度分级适用范围较窄的问题,通过计算属性值所属分类或区间的频率敏感度,为不易划分敏感级别的分类型属性以及数值型属性的敏感度量化提供了支持。 最后基于真实数据集设计实验,从抵御身份披露风险、敏感属性披露风险和数据效用三个方面验证改良匿名模型的有效性。实验结果表明,改良匿名模型进一步降低了数据集的敏感属性披露风险。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号