基于敏感度分级量化的微数据匿名模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着云计算和大数据技术的发展，科学研究和决策对开放数据的需求日益增大，由于数据集中往往包含个人不愿透露的敏感信息，使得隐私保护问题日益突出，成为了阻碍大数据发展的一个关键性问题。为保护所发布数据集中个体的隐私，计算机科学领域的研究者开展了对数据匿名化技术的研究。通常，数据匿名化技术首先设定一个匿名模型，接着通过泛化、抑制等手段对原始数据集进行匿名化处理，最后得到满足匿名模型的结果数据集。其中，匿名模型对数据集的特征进行了约束，其主要参数直接或间接地对隐私披露风险进行了限制。针对大数据时代的隐私保护问题，提出一种改进的匿名模型(w,l,k)-anonymity。首先分析了现有匿名模型的缺陷，如k-anonymity没有对敏感属性进行约束，因此无法抵御属性链接攻击。l-diversity与t-closeness均未考虑相同敏感属性中不同敏感属性值的敏感程度差异，对不同敏感程度的属性值进行了相同程度的保护，间接地增加了匿名数据集的敏感属性披露风险和数据效用损失。接着针对基于敏感度分级的匿名模型，总结了p+-sensitive k-anonymity与(p,α)-sensitive k-anonymity在实现机理上的不足，如p+-sensitive k-anonymity基于属性值的敏感度分级，保证了等价类中敏感属性值所属敏感级别的多样性，但是无法避免高敏感度属性值在等价类中的聚集现象。(p,α)-sensitive k-anonymity基于敏感度分级实现了敏感度权重的量化，但是其敏感度量化方式的合理性不足，无法限制等价类的整体敏感度，且不支持对数值型敏感属性值的敏感度量化等。然后针对(p,α)-sensitive k-anonymity的缺陷给出了改进方案，并在此基础上提出一种改进的基于敏感度分级量化的匿名模型。针对(p,α)-sensitive k-anonymity在量化敏感度权重方面合理性不足的问题，通过改进分级敏感度权重分配方法，引入了频率敏感度分量并与分级敏感度进行加权，优化了敏感度权重的量化机制；针对等价类元组个数差异对敏感度权重影响较大的问题，通过计算等价类的平均敏感度，限制了等价类的整体敏感度；针对敏感度分级适用范围较窄的问题，通过计算属性值所属分类或区间的频率敏感度，为不易划分敏感级别的分类型属性以及数值型属性的敏感度量化提供了支持。最后基于真实数据集设计实验，从抵御身份披露风险、敏感属性披露风险和数据效用三个方面验证改良匿名模型的有效性。实验结果表明，改良匿名模型进一步降低了数据集的敏感属性披露风险。

著录项

作者
周晨炜;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机技术
授予学位硕士
导师姓名董学文,刘贤刚;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;建筑设计;
关键词
敏感度; 分级量化; 数据; 匿名;

相似文献

中文文献
外文文献
专利

1. 一种基于粗糙微聚集算法及属性重要度的匿名模型的数据质量评估 [J] . 段文影 ,段隆振 ,邱桃荣 . 南昌大学学报（理科版） . 2015,第003期
2. 基于在线拍卖数据价格敏感度量化的实证研究 [J] . 王海青 ,徐江红 ,张欢欢 . 商场现代化 . 2011,第008期
3. 面向微聚集技术的k-匿名数据质量评估模型 [J] . 陈建明 ,韩建民 . 计算机应用研究 . 2010,第006期
4. 基于敏感性分级的（k，δ，ai）-匿名模型 [J] . 刘阳 ,祝永志 ,迟玉良 . 信息技术与网络安全 . 2018,第001期
5. 基于DC-Nets的分级匿名通信系统模型 [J] . 徐红云 ,陈建二 ,陈松乔 . 小型微型计算机系统 . 2006,第003期
6. 数据分级匿名的访问控制模型 [C] . 黄学臻 ,韩臻 ,刘吉强 . 第二十二届全国信息保密学术会议（IS2012) . 2012
7. 集值数据发布中敏感度自适应模型及匿名化方法研究 [A] . 陈刘华 . 2016

基于敏感度分级量化的微数据匿名模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅