声明
摘要
第1章 绪论
1.1 研究背景及意义
1.2 本文的研究内容
1.3 本文的组织结构
第2章 相关技术及平台
2.1 云计算
2.1.1 云计算概述
2.1.2 云计算特点
2.1.3 云计算体系结构
2.1.4 Hadoop MapReduce
2.2 数据挖掘
2.2.1 数据挖掘任务与常见算法
2.2.2 数据挖掘与云计算
2.3 其他云平台
2.4 本章小结
第3章 基于Hadoop的机票预测系统
3.1 问题描述与分析
3.2 基于Hadoop的机票预测问题建模
3.2.1 机票预测系统的设计
3.2.2 机票数据获取
3.2.3 机票数据分析
3.3 机票价格预测方法
3.3.1 机票Tsa_Ticket算法
3.3.2 Cluster_Predict_Ticket算法
3.4 Cluster_Predict_Ticket算法在Hadoop上的实现
3.4.1 Hadoop数据预处理
3.4.2 PTKMeans算法在Hadoop上并行实现
3.4.3 PTRF算法在Hadoop环境下的实现
3.4.4 PCluster_Predict_Ticket算法在Hadoop环境下的实现
3.4.5 模型的更新
3.5 实验与分析
3.5.1 数据预处理效率实验
3.5.2 Hadoop PTKMeans算法实验
3.5.3 Hadoop PTRF算法实验
3.5.4 PCluster_Predict_Ticket算法实验
3.6 本章小结
第4章 异构环境下Hadoop任务分配策略的改进
4.1 Hadoop调度策略研究
4.1.1 Hadoop调度流程
4.1.2 Hadoop常见调度器及调度策略
4.2 Hadoop任务分配问题建模
4.2.1 网络流的基本概念
4.2.2 Hadoop任务分配流网络
4.3 λ-Flow算法
4.3.1 Hadoop任务流网络初始化
4.3.2 Flow-SPFA算法
4.3.3 TaskMinCostMaxFlow算法
4.3.4 Hadoop任务分配λ-Flow算法
4.4 实验与结果
4.4.1 实验环境
4.4.2 λ-Flow算法运行时间
4.4.3 作业完成时间
4.4.4 作业完成时间与步长λ的关系
4.5 本章小结
第5章 总结与展望
5.1 本文总结
5.2 研究展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果