封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1 课题研究的背景和意义
1.2 国内外的研究现状
1.3 本文的主要研究内容
1.4 本文的组织结构
第二章 相关技术的研究
2.1 JavaScript脚本提取解析技术
2.2 Hadoop分布式计算
2.3 本章小结
第三章 动态页面脚本的提取解析与任务调度研究
3.1 Web信息采集系统整体结构
3.2 脚本的提取与解析
3.3 调度算法研究
3.4 脚本提取解析调度算法设计
3.5 本章小结
第四章 脚本提取解析系统的实现
4.1 系统整体结构
4.2 数据文件格式
4.3 系统MapReduce实现
4.4 本章小结
第五章 测试与结果分析
5.1 测试环境
5.2 系统测试与结果分析
5.3 本章小结
第六章 结论
6.1 总结
6.2 展望
参考文献
致谢