首页> 中文期刊> 《计算机科学与探索》 >基于k-prototype聚类的差分隐私混合数据发布算法

基于k-prototype聚类的差分隐私混合数据发布算法

         

摘要

差分隐私是一种提供强大隐私保护的模型.在非交互式框架下,数据管理者可发布采用差分隐私保护技术处理的数据集供研究人员进行挖掘分析.但是在数据发布过程中需要加入大量噪声,会破坏数据可用性.因此,提出了一种基于k-prototype聚类的差分隐私混合数据发布算法.首先改进k-prototype聚类算法,按数据类型的不同,对数值型属性和分类型属性分别选用不同的属性差异度计算方法,将混合数据集中更可能相关的记录分组,从而降低差分隐私敏感度;结合聚类中心值,采用差分隐私保护技术对数据记录进行处理保护,针对数值型属性使用Laplace机制,分类型属性使用指数机制;从差分隐私的概念及组合性质两方面对该算法进行隐私分析证明.实验结果表明:该算法能够有效提高数据可用性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号