声明
摘要
缩略词表
第一章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 数据本地化
1.2.2 MapReduce数据流水线
1.2.3 内存策略
1.2.4 现状总结
1.3 研究目标
1.4 研究内容
1.4.1 数据无冗余本地化存放与处理机制
1.4.2 数据发送流水线机制
1.4.3 内存管理方法
1.5 论文组织结构
第二章 StreamMapReduce系统设计方案
2.1 MapReduce
2.2 StreamMapReduce的系统结构
2.3 StreamMapReduce应用实例
2.3.1 问题分析
2.3.2 问题解决
第三章 数据本地化
3.1 hash划分法
3.2 概率统计划分法
3.3 数据本地化小结
第四章 中间数据分发流水线
4.1 数据分发具体过程
4.2 数据分发算法
4.3 分发流水线控制与调度
4.4 数据分发小结
第五章 内存管理
5.1 KVBTree概要
5.2 存储块结构
5.2.1 索引节点与顺序节点
5.2.2 数据节点
5.3 数据缓存机制
5.3.1 缓存索引表、缓存区、缓存信息表
5.3.2 内存访问方法
5.3.3 缓存机制分析
5.4 KVBTree定义及相关算法
5.4.1 KVBTree的定义
5.4.2 KVBTree算法概论
5.4.3 查找算法
5.4.4 插入算法
5.4.5 遍历算法
5.4.6 KVBTree算法小结
5.5 内存管理小结
第六章 系统集成与测试
6.1 系统集成架构
6.1.1 输入输出系统
6.1.2 内存管理系统
6.1.3 运算框架
6.2 测试环境
6.2.1 硬件环境
6.2.2 软件环境
6.2.3 测试数据集
6.2.4 流式数据模拟产生器
6.3 系统测试
6.3.1 KVBTree单节点负载测试
6.3.2 StreamMapReduce运行界面
6.3.3 StreamMapReduce性能测试
6.3.4 StreamMapReduce对比Hadoop、S4
第七章 总结与展望
7.1 研究成果总结
7.2 未来工作展望
参考文献
致谢
附录
作者在攻读硕士学位期间相关研究工作
作者简历
东南大学;