声明
摘要
第一章 绪论
1.1 研究背景
1.2 研究意义
1.3 论文研究内容
1.4 论文结构
第二章 数据处理背景知识
2.1 数据库的查询发展历程
2.2 数据流管理系统
2.2.1 基于窗口的处理
2.2.2 DSMS架构
2.2.3 语言扩展
2.3 海量数据处理技术介绍
2.3.1 Hadoop
2.3.2 HDFS
2.3.3 MapReduce
2.3.4 ZooKeeper
2.3.5 Pig
2.4 本章小结
第三章 海量数据处理解决方案
3.1 流技术的发展
3.2 流技术的要求
3.3 S4框架介绍
3.3.1 设计
3.3.2 处理单元
3.3.3 通信层
3.3.4 适配器
3.3.5 编程模型
3.4 改进后的S4系统—S4_S
3.4.1 S4_S架构
3.4.2 S4_S数据流
3.4.3 S4_S语言模型
3.5 本章小结
第四章 S4_S系统性能评估
4.1 网络服务监控器
4.2 预测新浪微博话题
4.3 评估S4_S系统
4.3.1 实验准备与测量方法
4.3.2 性能分析
4.3.3 性能评估总结
4.4 比较S4与S4_S
4.5 本章小结
第五章 总结及展望
5.1 总结
5.2 未来研究方向
致谢
参考文献
攻读硕士学位期间发表的论文