声明
摘要
第一章 绪论
第一节 研究背景和意义
第二节 国内外研究现状
1.2.1 数据挖掘技术在环境监测领域的研究现状
1.2.2 模糊关联规则挖掘的研究现状
第三节 本文组织结构
第二章 数量型属性的模糊划分
第一节 问题引入
第二节 基于CHC遗传模型的模糊划分方法
2.2.1 CHC遗传模型设计思路
2.2.2 编码方式及编码规则
2.2.3 种群初始化设计
2.2.4 适应度求值函数的选定
2.2.5 PNX交叉算子的设计
第三节 大气环境监测值的模糊化
第四节 实验分析
第三章 基于ffp-tree树头表改进的FP-Growth算法
第一节 TD-FP-Growth算法分析
第二节 问题的提出
第三节 ffp-tree树头表和结点数据结构的改进
3.3.1 ffp-tree头表单元的改进
3.3.2 ffp-tree树结点结构的优化
3.3.3 实例分析
第四节 算法分析
3.4.1 改进的FP-Growth算法同TD-FP-Growth算法的比较
3.4.2 改进的FP-Growth算法与Apriori算法比较
第五节 本章小结
第四章 基于MapReduce实现FP-Growth算法
第一节 FP-Growth算法中的可并行化点
第二节 FP-Growth算法的MapReduce化
4.2.1 拆分记录项
4.2.2 基于数组索引排序的频繁项集生成方法
4.2.3 构造ffp-tree的MapReduce设计
4.2.4 生成频繁项集的MapReduce设计
第三节 算法性能分析
4.3.1 改进的FP-Growth与MapRecuce化后的FP-Growth的比较
4.3.2 挖掘效率随数据量的变化情况
4.3.3 挖掘效率随Hadoop集群节点数变化
第四节 本章小结
第五章 总结与展望
参考文献
致谢
个人简历
南开大学;