首页> 中文学位 >多敏感属性微数据隐私保护匿名模型及算法研究
【6h】

多敏感属性微数据隐私保护匿名模型及算法研究

代理获取

摘要

网络时代涌现了大量与个体相关数据,即微数据,微数据对趋势分析,疾病预测以及经营决策具有重要的意义,因此很多组织开始收集和发布一些微数据,如医院会发布患者的医疗数据用于帮助医疗事业的研究与发展。然后,微数据的发布会对隐含在微数据中的个体隐私构成威胁。因此,近年来数据发布隐私保护的研究成为数据挖掘领域的研究热点。至今,该领域已出现了很多研究成果,然而这些成果多是面向单敏感属性的,而现实生活中存在大量多敏感属性微数据,单敏感属性的匿名模型及算法无法直接应用于多敏感属性微数据,因而,开展对多敏感属性微数据隐私保护模型及算法的研究具有重要意义。
  在多敏感属性微数据隐私保护的研究中,需要建立适合多敏感属性数据的匿名模型保证数据发布的安全性,同时还需要研究实现匿名模型的相应算法。本文从匿名化模型及相应的算法两方面,对多敏感属性微数据发布中的隐私保护问题进行了研究,具体工作有:
  (1)提出抵制多敏感属性关联攻击的(l,m)-多样性模型。现有的微数据发布隐私保护匿名模型均没有考虑敏感属性间的关联关系,不能抵制基于敏感属性间关系的攻击。为此,论文提出抵制敏感属性关联攻击的(l,m)-多样性模型,该模型要求匿名数据的每个等价类中,每维敏感属性上多样性至少为l,并且当某一敏感值从等价类中删除后,该等价类剩下的敏感值仍满足(l-1,m)-多样性。本文也提出了实现(l,m)-多样性的两个算法——BottomUp算法和TopDown算法。实验表明,所提出的算法能很好的实现面向多敏感属性的(l,m)-多样性模型,有效保护多敏感属性微数据的个体隐私。
  (2)提出SLOMS框架:一种面向多敏感属性的数据发布隐私保护方法。多维桶技术是匿名化多敏感属性数据较好的方法,然而在敏感属性数据较多时该方法会造成较大隐匿率。另外,该方法不泛化准标识属性容易受到连接攻击。为此,本文提出一种SLOMS方法,该方法将多敏感属性划分成多个表,分别对每个敏感属性表进行l-多样性分组,并且对准标识属性进行k-匿名泛化。本文也提出了一种基于SLOMS方法的MSB-KACA算法实现对微数据匿名化。实验表明,SLOMS方法产生的匿名数据表较泛化和多维桶技术具有较小隐匿率和较少信息损失。
  (3)提出面向多敏感属性隐私保护的分桶排列技术。分解技术是实现数据匿名的较好技术,然而分解未对准标识符处理,存在安全隐患。对此,本文提出分桶排列技术,该技术在分解的基础上,增加对准标识符的排列处理,同时结合多维桶分组技术应用于多敏感属性隐私保护中。本文也提出实现分桶排列技术的两种算法——NMBPA和CDMBPA。实验表明:两种算法均能较好的实现对多敏感属性数据的匿名化,产生的隐匿数据具有较好的数据可用性和较低的隐匿率,有效对多敏感属性隐私进行保护。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号