首页> 中文学位 >基于扰动技术的隐私保护数据挖掘研究
【6h】

基于扰动技术的隐私保护数据挖掘研究

代理获取

目录

声明

摘要

第一章 引言

1.1 研究背景及意义

1.2 基于扰动的隐私保护数据挖掘发展及研究现状

1.3 本文研究内容及逻辑结构

第二章 基于扰动方法的隐私保护挖掘基础

2.1 数据挖掘过程中的隐私保护研究之层级分类

2.2 隐私保护数据挖掘研究的技术分类

2.3 扰动方法概述

2.4 基于扰动方法的隐私保护基本思想

2.5 隐私保护算法的评估

2.5.1 数据结果的实用性

2.5.2 隐私保护程度

2.5.3 算法的难易程度

2.6 本章小结

第三章 基于扰动思想的决策树隐私保护研究

3.1 基于扰动的两种基本方法

3.2 决策树与决策树扰动的基本概念

3.3 在决策树中的扰动技术

3.3.1 基于特定数据集的原始决策树的生成

3.3.2 在决策树中进行扰动隐私保护的原理

3.3.3 基于扰动技术和决策树方法结合的数据隐私保护的拓展

3.3.4 针对决策树降级的扰动方法—吝啬降级法

3.4 本章小结

第四章 基于分区思想的扰动隐私保护算法研究

4.1 分区扰动方法概述

4.1.1 基本概念

4.1.2 分区扰动算法

4.2.基于分区扰动方法的计算实例

4.3 基于分区的扰动方法风险评估

4.4 本章小结

第五章 基于关联规则的扰动算法隐私保护研究

5.1 关联规则的概述

5.1.1 关联规则的相关概念

5.1.2 针对关联规则的数据挖掘方法实例

5.2 针对关联规则下的两种扰动算法

5.2.1 基于关联规则下的左手增加支持度法则

5.2.2 基于关联规则下的右手减少支持度法则

5.3 本章小结

结论与展望

参考文献

致谢

在校期间的科研成果

展开▼

摘要

近些年来,随着数据库技术和网络技术的发展,计算机数据存储功能不断进步,数据挖掘作为一个强有力的数据分析工具,在许多领域做出了巨大的贡献,具有广阔的应用前景。不断出现的各种数据挖掘算法指出,越来越多的信息可以从社会组织中直接获得,因此个人、企业或者事业单位之间的隐私安全保护问题显得日益重要。目前,在数据挖掘中,隐私保护最常见的是数据扰动方法。相对于传统的方法,基于统计学、数据分区以及关联规则下的扰动是一种十分高效的方法,可以较好的保护个人数据的隐私。
  本文针对数据挖掘中的隐私保护问题,基于数据扰动的思想方法,分别在决策树、分区环境和关联规则等三个方面进行了分析和研究,对保障用户的隐私保护需求给出了合理的解决方案。
  本论文的主要研究内容包括:
  (1)在扰动方法基础上提出隐私保护挖掘的层级分类,对目前隐私保护数据挖掘的各项技术进行系统分类,总结了基于扰动方法下的隐私保护算法的基本思想和原理,并对这些隐私保护方法从实用性、难易程度等方面进行分析评估。
  (2)在决策树方法研究的基础上,利用决策树结构特点与扰动算法的两种基本方法相结合,提出了针对决策树结构属性的扰动方法和决策树降级方法。在此基础上给出两个实例论证我们的方法的有效性。
  (3)通过对原始数据库进行分区的方法,结合扰动思想对原始数据进行隐私保护,研究了以kd-扰动树为基础的对于分区扰动方法,并对这种方法进行分析和风险评估。
  (4)以关联规则理论为基础研究了数据挖掘中对信息的规则隐私保护方法,并通过基于关联规则的两个扰动算法展开讨论,初步研究了关联规则扰动方法在保护隐私方面的应用问题。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号