封面
中文摘要
英文摘要
目录
1 绪 论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 本论文的主要贡献
1.4 论文的组织结构
2 MapReduce中配置参数的重要性分析
2.1 MapReduce介绍
2.2 Hadoop生态系统
2.3 Hadoop计算平台架构
2.4分布式文件存储HDFS
2.5 MapReduce配置参数分析
2.6 本章小结
3 基于核函数惩罚的聚类特征选择
3.1 引言
3.2 数据降维
3.3 特征选择和特征提取研究现状
3.4 聚类
3.5 核K-means(kernel K-means)聚类
3.6 聚类初始中心点的改进
3.7 基于核函数惩罚的聚类特征选择
3.8实验及分析
3.9 本章小结
4 MapReduce数据本地化优化研究
4.1 引言
4.2 数据本地化(Data Locality)
4.3 副本置放
4.4 数据本地化优化算法
4.5 实验及分析
4.6 本章小结
5 MapReduce任务调度优化研究
5.1 引言
5.2 Hadoop任务调度流程
5.3 Hadoop平台中现有的调度策略分析
5.4 任务调度中作业执行时间的不确定性
5.5 满足作业时间需求和资源优化的任务调度算法
5.6 实验及分析
5.7 本章小节
6 总结与展望
6.1 研究总结
6.2 未来展望
致谢
参考文献
附录
A. 作者在攻读学位期间发表的论文目录
B. 作者在攻读学位期间参加的科研项目