声明
摘要
第1章 绪论
1.1 研究背景
1.2 研究现状
1.3 本文主要内容及组织结构
第2章 云计算和频繁项目集挖掘概述
2.1 引言
2.2 云计算相关技术
2.2.1 分布式文件系统----HDFS
2.2.2 Map/Reduce编程模型
2.3 频繁项目集挖掘
2.3.1 频繁项目集相关概念
2.3.2 频繁项目集求解算法
2.4 本章小结
第3章 基于Apriori的频繁项目集并行挖掘算法
3.1 Apriori算法
3.2 基于迭代式Map/Reduce的并行挖掘算法
3.2.1 MRApriori算法思想
3.2.2 MRApriori的改进算法TR_MRApriori
3.3 实验结果与分析
3.4 本章小结
第4章 基于FP-Growth的频繁项目集并行挖掘算法
4.1 FP-Growth算法
4.2 基于FP-Growth的并行挖掘算法:FPPM
4.2.1 算法思想
4.2.2 计算1-项集的支持数
4.2.3 求解局部频繁项目集
4.3 基于FP-Growth的并行挖掘算法SBPFP
4.3.1 算法思想
4.3.2 计算1-项集的支持数
4.3.3 均衡分组
4.3.4 计算频繁项目集
4.4 实验结果与分析
4.4.1 FPPM算法实验
4.4.2 SBPFP算法实验
4.5 本章小结
第5章 基于Eclat的频繁项目集并行挖掘算法
5.1 Eclat算法
5.2 基于EcIat的并行挖掘算法MREclat
5.2.1 算法思想描述
5.2.2 数据初始化
5.2.3 负载平衡改进
5.2.4 计算频繁项目集
5.3 实验结果与分析
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
附录 攻读硕士学位期间发表论文情况
南京师范大学;