封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外的研究现状
1.3 目前存在的问题
1.4 研究的目标和内容
第二章 垂直搜索引擎的关键技术
2.1垂直搜索引擎工作原理
2.2网络爬虫技术
2.3 中文分词技术
2.4 网页去重技术
2.5 本章小结
第三章 新闻垂直搜索引擎的的总体方案设计
3.1 系统的需求分析
3.2 系统设计要求
3.3系统功能模块设计
3.4本章小结
第四章 新闻垂直搜索引擎系统的设计与实现
4.1网络爬虫子系统的设计与实现
4.2 网页提取模块设计
4.3 分词模块设计
4.4 网页去重设计
4.5 索引模块设计
4.6本章小结
第五章 新闻垂直搜索引擎的试验结果
5.1 系统开发平台
5.2 网页提取模块试验结果及分析
5.3 索引建立试验结果
5.4 中文分词试验
5.5 去重模块试验
5.6 程序最终运行结果
5.7 本章小结
第六章 结论与展望
6.1 结论
6.2 工作展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
长安大学;