摘要
第1章 绪论
1.1 研究背景与目的意义
1.2 国内外研究现状
1.2.1 抓取模型
1.2.2 抓取策略
1.3 主要研究工作与方法
1.4 主要研究内容
第2章 相关技术理论介绍
2.1 构建RIA的关键技术
2.1.1 Ajax的原理和简介
2.1.2 jQuery的原理和简介
2.2 模型和策略的理论介绍
2.2.1 抓取模型架构理论
2.2.2 抓取策略理论
2.3 Scrapy框架介绍
2.4 Selenium简介
2.5 本章小结
第3章 模型与策略分析
3.1 抓取研究面临的问题
3.2 抓取模型问题分析
3.2.1 脚本解析问题分析
3.2.2 用户事件触发问题分析
3.3 抓取策略问题分析
3.3.1 页面建模问题分析
3.3.2 抓取算法问题分析
3.4 本章小结
第4章 模型与策略设计
4.1 抓取模型设计
4.1.1 抓取模型架构设计
4.1.2 脚本解析方案设计
4.1.3 事件触发方案设计
4.1.4 模型主要模块处理流程设计
4.2 抓取策略设计
4.2.1 目标页面建模方案设计
4.2.2 抓取算法方案设计
4.2.3 抓取策略处理流程设计
4.3 本章小结
第5章 实例运行实验
5.1 实验环境
5.1.1 硬件环境
5.1.2 软件环境
5.1.3 实验环境架构
5.2 初始设置
5.2.1 系统支持组件包部署
5.2.2 URLs及Rules初始实验数据设置
5.2.3 Spider模块参数设置
5.3 其它参数设置
5.4 实验及结果
5.5 结果分析
5.6 本章小结
第6章 总结与展望
6.1 总结
6.2 不足与展望
参考文献
致谢
声明