声明
摘要
1 绪论
1.1 研究背景
1.2 研究意义
1.3 国内外研究现状
1.4 本文研究内容
1.5 本文组织结构
1.6 本章小结
2 相关研究综述
2.1 Apriori算法介绍
2.1.1 经典Apriori算法相关定义
2.1.2 Apriori算法关联规则的挖掘步骤
2.2 GPU通用计算与CUDA
2.2.1 CUDA编程模型
2.2.2 CUDA存储器模型
2.3 GPU集群介绍
2.4 云计算和AWS
2.4.1 云计算基础概念
2.4.2 亚马逊云服务(Amazon Web Services,AWS)
2.5 本章小结
3 基于AWS云平台GPU集群的Apriori算法设计和实现
3.1 Apriori算法对于数值型事务数据的处理
3.2 总体架构设计
3.2.1 Apriori算法分析
3.2.2 总体并行优化设计
3.3 AWS平台GPU集群架构的设计与搭建
3.3.1 GPU集群设计
3.3.2 GPU集群搭建
3.4 Apriori算法进程间并行改进与实现
3.4.1 任务分配负载均衡
3.4.2 进程间通信方式MPI
3.4.3 候选项集的生成与剪枝
3.5 Apriori算法进程内并行改进与实现
3.5.1 事务数据的拷贝
3.5.2 候选频繁项集支持计数
3.6 实验与分析
3.6 本章小结
4 基于AWS GPU集群加速的Apriori算法的应用
4.1 大数据医疗趋势以及乳腺癌诊断应用的需求分析
4.2 乳腺癌肿瘤类型诊断应用总体设计
4.3 乳腺癌医疗数据的收集与处理
4.4 使用Apriori算法进行关联规则挖掘
4.4.1 候选频繁项集支持计数
4.4.2 利用频繁项集生成关联规则
4.5 利用关联规则对乳腺癌患者进行诊断
4.6 乳腺癌诊断应用的实现
4.7 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢