首页> 中文学位 >基于邻域相关性的聚类数据隐私保护方法研究
【6h】

基于邻域相关性的聚类数据隐私保护方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1研究背景及目的

1.2研究现状

1.3论文的研究内容与组织结构

第2章 相关知识

2.1引言

2.2数据挖掘

2.3数据聚类概述

2.4数据扰动方法

2.5数据聚类可用性相关原理

2.6聚类质量评价

2.7本章小结

第3章 邻域相关及圆内四象限数据扰动方法

3.1相关概念

3.2 NCDP扰动方法参考

3.3 NCCQDP扰动方法

3.4 NCCQDP扰动方法流程,

3.5相关性质

3.6 NCCQDP扰动方法伪代码

3.7 NCCQDP扰动方法评价

3.8本章小结

第4章 实验结果及分析

4.1引言

4.2实验环境

4.3实验设计与测试数据

4.4实验结果

4.5本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

近年来,如何保证数据经过扰动后在数据隐私保护安全问题上同时能够兼顾数据聚类可用性成为难点。如何确保在发布数据的过程中,能够同时满足数据隐私保护安全性与数据聚类可用性,是摆在现实社会中一个极具挑战与艰巨且迫切的问题。然而,尽管可行的扰动方法能够确保经过扰动后的数据自身安全性,但是却严重地忽略了数据聚类的结果。
  通过对已有的数据隐私保护安全性及数据聚类可用性方法进行深入地研究,发现基于邻域相关性对数据进行扰动,可以更好的达到隐私保护安全性和数据聚类可用性两者的兼容,但仍不能很好地满足两者间的平衡。针对此问题,本文提出了一种基于NCDP扰动方法的改进型方法,基于邻域圆内四象限扰动方法NCCQDP(Neighborhood CorrelationClusteringBasedOnData Perturbation for Four-Quadrants of Circle)。NCCQDP扰动方法主要从两个角度对NCDP扰动方法进行改进,且通过牺牲空间复杂度,来使得保证隐私保护安全和数据聚类可用性两者之间达到平衡,获得期望中的效果,从而提高隐私保护安全性概率及数据聚类可用性。该算法主要有三个步骤,包括基于邻域密度寻找聚簇质心;对数据点记录集进行粗聚类;对数据进行圆内四象限扰动。
  最后,本文通过实验对提出的算法进行验证,将NCCQDP扰动方法和已有的RBT扰动方法、NCDP扰动方法进行比较、分析。结果表明NCCQDP扰动方法能够在隐私保护与数据聚类可用性方法两者间达到平衡。最后,讨论了今后进一步改进的方向。

著录项

  • 作者

    王琪;

  • 作者单位

    哈尔滨工程大学;

  • 授予单位 哈尔滨工程大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 刘杰;
  • 年度 2014
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    数据聚类; 隐私保护; 邻域相关性; NCCQDP扰动方法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号