面向聚类的多敏感属性数据发布隐私保护研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据发布在数据管理、数据挖掘和信息共享应用中有着重要的地位。高速发展的互联网使得海量数据的收集、发布及分析更加便捷，但与此同时，也给用户个人隐私带来了威胁。在现实生活中，有很多机构需要定期对外发布数据。例如，医院定期发布医疗统计数据，上市公司定期发布的财务报表，等等。这些数据中存在大量的个人敏感信息，如果泄露将会造成不可估量的损失。实际场景中，数据中存在不止一个敏感属性，所以，我们对数据发布中存在不止一个敏感属性的隐私研究迫在眉睫，尤其是对多敏感属性数据发布中的多维数值敏感属性个性化隐私保护问题，更是探讨热点，分析这一问题通常需要采用聚类的方法处理数据，所以称之为面向聚类。
　　首先，论文分析了现有数据发布中保护隐私的各种方法，包括匿名隐私保护模型、匿名技术、应用聚类的匿名方法等等，从中得出不同匿名模型和匿名技术的优缺点。
　　其次，论文对数据发布中多敏感属性的隐私保护技术进行深入探讨，指出传统的多敏感属性数据发布方法在保护隐私上存在不足。针对多维数值敏感属性数据发布隐私保护方法中，很少考虑数值敏感属性的属性值权重的个性化隐私问题。提出基于聚类和加权多维桶分组的个性化隐私保护方法。该方法首先通过聚类单独将各维数值敏感属性的属性值划分到多个聚簇中，然后为多维数值敏感属性构建加权多维桶，将表中数据记录映射到对应多维桶中，通过考虑加权选择度的最大维容量优先算法，选择多维桶中的数据记录，构建满足l-diversity的分组，最后将得到分组的准标识符进行泛化，将分组以匿名表形式发布。实验结果表明，发布的匿名数据表，满足l-diversity的同时，避免了相似性攻击，具有较低信息损失和较低的隐匿率，以及较高的数据拥有者定义重要记录可发布性，达到个性化隐私保护效果。
　　最后论文对多敏感属性数据发布中的多维数值敏感属性数据发布个性化匿名技术进行深入探讨，针对传统方法中，很少同时考虑数值敏感属性的权重和敏感值的权重的问题。提出了一种基于聚类和个性化加权(数据记录权重)选择度的匿名算法，该方法利用最小个性化数据记录选择度优先的思想，选择数据记录构成满足l-diversity的分组，最后将得到分组的准标识符进行泛化，将分组以匿名表形式发布，达到个性化隐私保护。实验结果证明，此方法在保证数据隐私和个人或者数据拥有者隐私需求的同时，也具有较高的数据发布质量。

著录项

作者
陆洋;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科软件工程
授予学位硕士
导师姓名周国强;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类数据安全;
关键词
数据发布; 多敏感属性; 隐私保护; 匿名算法;

相似文献

中文文献
外文文献
专利

1. 面向敏感性攻击的多敏感属性数据逆聚类隐私保护方法 [J] . 张冰 ,杨静 ,张健沛 . 电子学报 . 2014,第005期
2. 网络中多敏感属性数据发布隐私保护研究 [J] . 魏锐 ,李留青 . 电子设计工程 . 2014,第017期
3. DCKPDP:改进k-prototype聚类的差分隐私混合属性数据发布方法 [J] . 张星 ,张兴 . 计算机应用研究 . 2022,第1期
4. 多敏感属性数据发布的隐私保护方法分析 [J] . 杨丽丽 . 数字通信世界 . 2019,第006期
5. 基于DMSA算法的多敏感属性数据重发布隐私保护新策略 [J] . 左苏楠 ,卞艺杰 ,吴慧 . 计算机系统应用 . 2016,第002期
6. 基于事务型k-anonymity的动态集值属性数据重发布隐私保护方法 [C] . Wu Yi ,武毅 ,Wang Dan . 第30届中国数据库学术会议 . 2013
7. 面向多敏感属性数据发布的隐私保护研究 [A] . 周娟 . 2018

面向聚类的多敏感属性数据发布隐私保护研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅