声明
摘要
第一章 绪论
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.3 本文主要研究内容
1.4 本文结构安排
1.5 本章小结
第二章 相关理论与平台
2.1 关联规则概述
2.1.1 关联规则基本概念
2.1.2 关联规则定理
2.1.3 关联规则挖掘过程
2.1.4 关联规则分类
2.2 关联规则相关算法简介
2.2.1 基于水平数据格式的Apriori系列算法
2.2.2 基于垂直数据格式的Eclat系列算法
2.2.3 基于树形数据格式的FP-Growth系列算法
2.3 Eclat算法详解
2.3.1 Eclat算法介绍
2.3.2 Eclat算法实例描述
2.4 分布式平台简介
2.4.1 Hadoop平台简介
2.4.2 Spark平台简介
2.5 本章小结
第三章 基于位存储Tid的CPU并行化Eclat算法-BPEclat算法
3.1.1 内存消耗问题
3.1.2 挖掘效率问题
3.2.1 BPEclat算法改进策略
3.3 BPEclat算法实现策略
3.3.1 位垂直Tid列表的数据结构
3.3.2 位垂直Tid列表的生成
3.3.3 候选项目的支持度计数
3.3.4 多线程挖掘任务分配
3.4 算法整体流程图
3.5 本章小结
第四章 基于Spark平台的BPEcalt算法-SBPEcalt算法
4.1 基于Spark框架的分布式化与原理
4.1.1 并行思想概述
4.1.2 数据分区策略
4.2 SBPEclat算法实现策略
4.3 算法整体流程图
4.3 本章小结
第五章 算法实现与实验结果分析
5.1.2 实验结果对比与分析
5.2 SBPEclat算法实现与实验结果分析
5.2.1 实验环境与实验数据
5.2.2 实验结果对比与分析
5.3 本章小结
总结与展望
参考文献
致谢