封面
声明
中文摘要
英文摘要
目录
第一章绪论
1.1 研究背景及意义
1.2国内外研究现状
1.3 搜索模型概述
1.4 研究内容
1.5 本文组织结构
第二章搜索引擎的整体架构与关键技术
2.1 搜索引擎的体系结构
2.2 中文分词
2.3 倒排索引
2.4 链接分析
第三章
3.1 引言
3.2 PageRank的原始求和方法
3.3 “黑洞”问题
3.4 马尔科夫修正
3.5 本章小结
第四章针对烟草行业的主题判别
4.1 引言
4.3 种子URL的选取
4.3 超链接判别
4.4 元信息判别
4.5 词库判别
4.6 本章小结
第五章 垂直搜索引擎的设计与实现
5.1 需求分析
5.2 主题爬虫的设计与实现
5.3 文档评分及排序
5.4 查询交互页面
5.5搜索引擎的评价原则
5.6 本章小结
第六章 总结与展望
6.1 全文总结
6.2 研究展望
参考文献
致谢
攻读学位期间的研究成果