封面
声明
中文摘要
英文摘要
目录
第1章 绪 论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文的主要工作
1.4 论文组织结构
第2章 相关理论知识和关键技术
2.1 聚类分析
2.2 分布式计算平台Hadoop
2.3 内存计算平台Spark
2.4 Web服务和Restful接口
2.5 本章小结
第3章 基于Hadoop的AP聚类并行化方法设计与实现
3.1 AP聚类的性能瓶颈
3.2 MapReduce并行化基本方法
3.3 并行化AP聚类设计思想
3.4 并行化AP聚类实现问题
3.5 基于MapReduce框架的并行AP聚类设计与实现
3.6 实验验证及结果分析
3.7 本章小结
第4章 基于Spark的AP聚类的并行化方法设计与实现
4.1 传统MapReduce计算模式到Spark的转换
4.2 Spark环境下并行AP聚类设计与实现
4.3 Hadoop与Spark并行AP聚类实验性能比较
4.4 两种环境下并行方法的比较与分析
4.5 本章小结
第5章 基于云的聚类分析服务平台
5.1 服务平台总体架构
5.2 服务平台各层实现
5.3 服务平台测试
5.4 本章小结
第6章 结论与展望
6.1 结论
6.2 工作展望
参考文献
致谢
攻读学位期间参加的科研项目和成果