首页> 中文学位 >分布式数据挖掘隐私保护问题研究
【6h】

分布式数据挖掘隐私保护问题研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1研究背景及意义

1.2相关研究的发展动态

1.2.1电子商务的发展概况

1.2.2推荐系统与数据挖掘技术综述

1.2.3隐私保护数据挖掘算法及应用综述

1.3本文研究内容及结构安排

1.3.1研究内容

1.3.2结构安排

第二章 推荐系统与数据挖掘

2.1引言

2.2推荐系统中的推荐技术

2.2.1基于内容的过滤技术

2.2.2协同过滤技术

2.2.3混合推荐技术

2.3数据挖掘技术

2.3.1数据挖掘的定义

2.3.2数据挖掘技术分类

2.3.3数据挖掘一般流程

第三章 分布式数据挖掘中的隐私保护问题

3.1分布式数据挖掘引发的隐私问题

3.1.1一般数据挖掘中的隐私保护问题

3.1.2分布式数据挖掘中的隐私保护问题

3.2传统的数据挖掘隐私保护算法

3.2.1量化隐私

3.2.2重构原始分布

3.2.3通过划分加快计算速度

3.2.4停止计算的标准

3.3关联规则挖掘算法的隐私保护

3.3.1 Apriori算法

3.3.2 MWFI算法

3.3.3基于RRPH的频繁项集生成算法

3.4安全多方计算

3.4.1安全求和计算

3.4.2安全并集算法

3.4.3安全计算交集大小

3.4.4安全数量积计算

第四章 数据挖掘隐私保护系统实现

4.1协同过滤算法中的隐私保护

4.2安全数量积计算算法

4.3安全数量积计算系统实现

结论

参考文献

攻读学位期间发表论文

致谢

附录:系统部分代码

展开▼

摘要

随着网络、通信和信息技术的突破性进展,Internet在全球爆炸性增长并迅速普及。电子商务作为一种全新的商务模式,以其高效率、低成本的特点迅速受到人们的关注,B2B、B2C等商业模式的快速成熟使得电子商务也得到了迅猛发展。电子商务不仅具有快捷、灵活、便利等特点,其低能耗低成本的优点以及它所提供的应用平台使得用户可以随时随地通过笔记本或PDA等移动终端接入。然而,考虑到电子商务本身所具有的安全问题以及由其移动性带来的潜在的安全问题,其隐私保护问题逐渐凸显,它对商业模式的发展产生了影响。本研究提出了在电子商务推荐系统中如何进行隐私保护的问题,利用安全多方计算的算法,计算出分布式条件下的项集支持度,将其在计算机上进行仿真实验,并应用到实际的电子商务环境中。主要内容如下: ⑴推荐系统中隐私保护问题的重要性分析:推荐系统是近年来数据挖掘领域中的研究热点之一,如何在保证高质量的推荐结果的同时达到隐私保护的目的是本文所要研究的重点。随着科学技术的突飞猛进,计算机的处理能力和存储能力都有大幅度的提高,因此许多大型的数据库以分布式的形式存储在不同的站点上,由此引发了分布式环境下推荐系统的隐私保护问题,其重要性也是不容忽视的。 ⑵数据挖掘隐私保护的算法研究:主要介绍集中式和分布式结构下,隐私保护的主要算法及有何不同。在集中式环境下,主要是对原始数据进行干扰,并重构其分布;在分布式环境下则通过加密技术处理原始数据以达到隐私保护的目的。目前有关集中式数据的隐私保护算法的研究要远远多于对分布式的研究。 ⑶如何将安全多方计算算法应用于数据挖掘中的关联规则挖掘:即通过分析比较四种不同的安全多方计算算法,找出最符合关联规则挖掘条件的,并对其进行充分的学习。本文中所使用的安全数量积计算算法是一种功能强大的算法,十分适合于关联规则挖掘中的频繁项集的计算。 ⑷分布式隐私保护在推荐系统中的具体应用:通过具体的实例,完成分布式隐私保护在推荐系统中具体应用的实现,对整个过程进行分析评价,指出日后改进的方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号