封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1研究背景及意义
1.2主题爬虫的国内外研究现状
1.3本文的研究内容
1.4本文结构
第二章 主题爬虫相关理论知识
2.1主题爬虫的原理和分类
2.2 当前网页应用热点技术及其发展趋势
2.3深层网络主题爬虫
2.4事件驱动
2.5 DOM树结构
2.6本章小节
第三章 主题爬虫相关算法分析
3.1中文分词
3.2相关性分析
3.3过滤算法
3.4本章小节
第四章 基于定题领域及事件驱动的深层主题爬虫研究
4.1 基于定题领域及事件驱动的深层主题爬虫的相关定义与模型
4.2 EDDTC的设计
4.3 EDDTC的实现
4.4测试结果与分析
4.5本章小结
第五章 基于定题领域及协议驱动的主题爬虫研究
5.1系统概述
5.2各模块的算法与实现
5.3实验与测试结果
5.4 本章小节
第六章 总结与展望
致谢
参考文献
附录A 攻读硕士期间发表的论文目录
附录B 攻读硕士期间参加的研究项目