声明
致谢
摘要
1 绪论
1.1 研究背景
1.2 研究现状
1.3 工作内容
1.4 论文组织结构
2 JS解析与分布式计算
2.1 JavaScript解析
2.1.1 JavaScript脚本语言
2.1.2 JavaScript解析引擎
2.2 Hadoop分布式计算
2.2.1 分布式计算
2.2.2 Hadoop框架
2.2.3 Map/Reduce研究
2.2.4 HDFS文件存取
2.3 本章小结
3 JS解析与任务调度算法研究
3.1 系统整体结构
3.2 JavaScript提取和运行环境
3.2.1 JavaScript提取和解析流程
3.2.2 JavaScript提取算法
3.2.3 JavaScript解析对象
3.3 JavaScript解析任务调度
3.3.1 Map/Reduce原有调度算法
3.3.2 容量调度算法
3.3.3 公平调度算法
3.3.4 自适应调度算法
3.3.5 Map/Reduce调度算法总结
3.4 本章小结
4 分布式JS解析系统的构建
4.1 系统工作流程
4.2 网页爬取
4.3 JavaScript提取
4.4 JavaScript解析任务调度
4.4.1 Datanode状态采集
4.4.2 Namenode任务调度
4.5 JavaScript解析任务调度
4.5.1 JavaScript解析环境管理
4.5.2 Map/Reduce实现
4.6 本章小结
5 分布式JS解析系统的测试与分析
5.1 测试环境
5.2 软件环境搭建
5.3 系统测试与分析
5.3.1 系统测试
5.3.2 结果分析
5.4 测试结果总结
5.5 本章小结
6 总结与展望
6.1 论文总结
6.2 展望
参考文献
作者简历
学位论文数据集