文摘
英文文摘
声明
第1章前言
1.1课题的背景与意义
1.2国内外研究现状
1.3论文研究内容
1.4论文组织结构
第2章搜索引擎研究
2.1搜索引擎的定义
2.2搜索引擎的分类
2.2.1按检索工具发展过程分类
2.2.2按检索范围分类
2.2.3按工作方式分类
2.3搜索引擎的工作原理
2.3.1搜索引擎的体系结构
2.3.2搜索引擎的工作流程
2.4搜索引擎检索性能评价
2.4.1查全率
2.4.2查准率
2.4.3相关性范畴
2.4.4相对查准率
2.5搜索引擎的发展趋势
第3章Web挖掘及其在搜索引擎中的应用
3.1 Web挖掘的定义
3.2 Web挖掘的分类
3.2.1 Web内容挖掘(Web Content Mining)
3.2.2 Web结构挖掘(Web Structure Mining)
3.2.3 Web日志挖掘(Web Usage Mining)
3.3 Web挖掘在搜索引擎中的应用研究
3.3.1 Web内容挖掘在搜索引擎中的应用
3.3.2 Web结构挖掘在搜索引擎中的应用
3.3.3 Web日志挖掘在搜索引擎中的应用
第4章Web结构挖掘算法PageRank改进研究
4.1 PageRank算法
4.1.1传统PageRank算法
4.1.2主题敏感的PageRank算法
4.1.3结合文本内容的PageRank算法
4.2 PageRank算法问题描述
4.3传统PageRank算法改进研究
4.3.1 Web页面相似度
4.3.2算法改进思想
4.3.3改进策略
4.3.4实验验证
4.3.5实验结果分析
4.4主题敏感PageRank算法改进研究
4.4.1主题向量的定义
4.4.2算法改进思想
4.4.2算法改进策略
4.4.3算法改进分析
4.5小结
第5章改进Web挖掘算法在搜索引擎中的应用
5.1网页搜集
5.2网页预处理
5.2.1计算页面与各主题向量的相似度
5.2.2计算页面的PageRank值
5.3查询服务
5.3.1计算查询词与主题的相关度
5.3.2计算查询词与网页的相关度
5.3.3计算页面排序值
5.3.4搜索结果返回
5.4检索性能评价
5.4.1检索性能评价指标
5.4.2计算搜索引擎查准率
5.5结果分析
5.6小结
第6章总结与展望
6.1全文总结
6.2课题创新点
6.3研究展望
参考文献
致谢
个人简历及在学期间的研究成果