微数据发布中提高匿名数据可用性的匿名化方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

微数据在数据分析和科学研究等领域发挥着越来越重要的作用。因此，越来越多的组织机构收集并共享微数据，然而微数据的发布和共享会泄漏包含在数据中的隐私信息。因此，微数据发布中隐私保护问题近几年来成为数据挖掘领域的研究热点。
　　目前在微数据发布的隐私保护领域中，匿名化技术是该领域中的主流方法，其主要思想是通过对原始待发布数据的处理，减少个体身份被攻击者唯一标识的概率，从而实现个体的隐私保护。本文通过结合噪音技术、模糊粗糙集等领域知识，对微数据发布中隐私保护在匿名数据可用性上进行了研究，主要工作如下:
　　(1)提出了将泛化和噪音技术相结合的隐私保护匿名化方法的研究。在现有的实现k-匿名模型的隐私保护方法中，泛化技术的应用相当广泛。尤其是在数据分布均匀的状况下，其数据匿名效果较好。但当数据规模不是很大，分布不均匀的情况下，会出现数据泛化程度过大，匿名数据可用性过低的问题。针对这个缺陷，本文提出了噪音和泛化技术相结合的GN匿名方法，该方法通过在泛化过程中添加噪音降低泛化程度;并提出噪音添加模型，保证添加噪音后的匿名数据中敏感属性分布与原始数据基本不变;还提出了实现算法GN-Bottom-up算法，且实验证明GN方法比原始一般匿名方法能有效降低泛化的程度，提高数据的可用性。
　　(2)提出了基于模糊粗糙集的加权聚类隐私保护方法的研究。在现有隐私保护方法产生的匿名数据中，普遍存在针对聚类应用的可用性差问题。针对该问题，本文提出一种考虑属性权重的隐私保护方法（FSRS)。其中通过基于模糊粗糙集的客观权重分配方法，得到属性权重以更好进行聚类泛化，达到提高数据聚类应用的目的。本文还通过Weka中聚类效果分析验证该方法的有效性。
　　(3)提出了基于粗糙集理论的匿名化方法的研究。在工作点二的研究基础上，本文提出了一种改进后考虑属性权重的隐私保护方法(PBRS)。其中各个属性的权重由粗糙集中系统属性重要度定义的方法获得。本文也通过Weka中聚类效果分析验证该方法的有效性。

著录项

作者
马叶灵;
展开▼
作者单位

浙江师范大学;

展开▼
授予单位浙江师范大学;
学科计算机软件与理论
授予学位硕士
导师姓名王基一,韩建民;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类模糊数学;
关键词
微数据发布; 匿名数据; 隐私保护; 模糊粗糙集; 数据可用性;
入库时间 2022-08-17 11:20:39

相似文献

中文文献
外文文献
专利

1. 数据发布中的个性化隐私匿名技术研究 [J] . 王波 ,杨静 . 计算机科学 . 2012,第004期
2. 数据发布中的匿名化技术研究综述 [J] . 刘喻 ,吕大鹏 ,冯建华 . 计算机应用 . 2007,第010期
3. 面向数据挖掘的匿名化隐私数据发布系统设计 [J] . 吴响 ,俞啸 ,王换换 . 电子技术应用 . 2016,第011期
4. 数据表k-匿名化的微聚集算法研究 [J] . 韩建民 ,岑婷婷 ,虞慧群 . 电子学报 . 2008,第010期
5. 一种医疗数据发布匿名化模型 [J] . 冷建宇 ,郭永安 . 工业控制计算机 . 2021,第004期
6. 基于匿名方法的数据发布隐私泄露控制技术进展分析 [C] . 滕金芳 ,钟诚 . 2009年广西计算机学会学术年会 . 2009
7. 微数据发布中的隐私保护匿名化算法研究 [A] . 夏赞珠 . 2011

微数据发布中提高匿名数据可用性的匿名化方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅