声明
摘要
第1章 绪论
1.1 问题背景
1.2 研究现状
1.2.1 MapReduce Online Prototype(HOP)
1.2.2 Nova
1.2.3 Incoop
1.2.4 其他并行处理系统
1.3 本文研究内容
1.4 本文组织结构
第2章 即时增量数据分析框架总体架构
2.1 相关研究基础简介
2.1.1 MapReduce工作流程
2.1.2 MapReduce的容错和负载均衡
2.1.3 HBase简介
2.1.4 Hadoop与HDFS
2.2 IncRT_MR的总体设计
2.3 IncRT_MR中任务执行流程
2.4 容错和负载均衡
2.5 小结
第3章 即时增量数据分析框架详细设计及实现
3.1 输入数据处理
3.1.1 文件系统中的文件分块
3.1.2 HBase中文件分块
3.2 增量数据计算
3.2.1 状态表的设计
3.2.2 Map阶段增量处理
3.2.3 Reduce阶段的增量处理
3.3 即时数据处理
3.3.1 数据阻塞原因
3.3.2 延迟解决方案
3.3.3 验证与分析
3.4 连续任务处理
3.5 容错与负载均衡
3.5.1 IncRT_MR的容错机制
3.5.2 IncRT_MR的负载均衡机制
3.6 小结
第4章 实时调度算法
4.1 MapReduce调度原理
4.2 实时调度算法的关键问题
4.3 两阶段实时调度算法
4.3.1 定义
4.3.2 任务运行时间估计
4.3.3 动态资源分配
4.3.4 调度策略
4.3.5 调度算法描述
4.4 实验与结果分析
4.5 小结
第5章 总结与展望
5.1 本文的工作与创新
5.2 工作展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果