面向大数据发布的差分隐私保护技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在大数据及网络无所不在的时代，海量个人信息被收集用于数据挖掘，以获得具有经济或社会意义的潜在价值。由于数据公开要求或受利益驱使，相关机构需要发布或交换收集到的数据。直接发布原始数据会泄露个人隐私，但恰恰这些数据中包含的敏感信息对于数据挖掘最有价值。如何在确保隐私安全的同时保持数据使用价值已经成为数据发布领域的研究热点。
　　隐私保护模型主要分为分组匿名和差分隐私。分组匿名易受背景知识攻击且缺陷层出不穷，而差分隐私与背景知识无关且经过严格数学证明并提供量化可控的隐私保护能力。因此，差分隐私被业界广泛认可并逐渐成为研究热点。但差分隐私模型存在引入噪声过大，数据可用性不高及实现困难多的问题。
　　现有面向数据挖掘的差分隐私发布方法中，将K-匿名模型和差分隐私相结合的DiffGen算法是公认较好的算法。该算法以构建决策树的方式完成对原始记录“先泛化，后逐步精确化”的分组发布过程。但该算法生成的数据集的分类准确率不够理想，对给定的隐私保护预算利用不够充分。
　　本文主要研究工作如下：
　　1.研究面向分类的差分隐私保护发布领域的主要技术，并且深入研究DiffGen算法的思想，针对其不足之处提出改进方案。首先，分析比较了指数机制可用性函数，使用基尼增益替代信息熵增益和最大频度。然后，研究其隐私预算分配方案，找出其利用不充分的问题。最后，提出自己的改进算法GiniDiff。
　　2.对改进方案进行实现，并研究实现过程中的难题，用实验结果验证改进效果。首先，使用面向对象方法解决泛化匿名实现问题。然后，提出算法解决指数机制和拉普拉斯机制只有定义框架而难于实现的问题。
　　实验结果表明，改进的算法在同等条件下发布的数据集的分类准确率和DiffGen算法相比有明显优势，且接近原始数据集的分类准确率。

著录项

作者
孙奎;
展开▼
作者单位

河南科技大学;

展开▼
授予单位河南科技大学;
学科计算机科学与技术
授予学位硕士
导师姓名张志勇;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类安全保密;
关键词
隐私保护; 差分隐私模型; 算法改进; 分类准确率; 大数据发布;

相似文献

中文文献
外文文献
专利

1. 面向电力工控网络大数据的微聚集差分隐私保护方法 [J] . 程伟华 ,谭晶 ,徐明生 . 南京理工大学学报（自然科学版） . 2019,第005期
2. 面向位置大数据的差分隐私保护研究 [J] . 张建坤 ,马永发 ,谢蔚 . 软件导刊 . 2018,第011期
3. 面向位置大数据的差分隐私保护研究 [J] . 张建坤1 ,马永发1 ,谢蔚1 . 软件导刊 . 2018,第011期
4. 面向轨迹数据发布的个性化差分隐私保护机制 [J] . 田丰 ,吴振强 ,鲁来凤 . 计算机学报 . 2021,第004期
5. 一种面向数据流top-k频繁模式发布的差分隐私保护方案 [J] . 梁文娟 ,陈红 ,赵素云 . 计算机学报 . 2021,第004期
6. 浅析医疗大数据中应用差分隐私保护 [C] . 白云璐 . 第四届中国中医药信息大会 . 2017
7. 面向数据发布的差分隐私保护技术研究 [A] . 徐波 . 2018

面向大数据发布的差分隐私保护技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅