声明
摘要
1绪论
1.1论文研究背景及意义
1.2国内外研究现状
1.3 论文的主要工作
1.4 论文的组织结构
2文本相似度计算技术
2.1文本预处理
2.1.1文本分词
2.1.2停用词过滤
2.2特征性权重计算
2.3特征向量模型
2.3.1布尔模型
2.3.2概率模型
2.3.3向量空间模型(VSM)
2.4文本相似度度量
2.5本章小结
3网页排序算法
3.1 PageRank算法
3.2 PageRank算法的优缺点
3.3 现有改进算法
3.3.1主题敏感PageRank算法
3.3.2基于锚文本的PageRank算法
3.3.3基于时间权重的PageRank算法
3.3.4基于用户个性化的PageRank算法
3.4本章小结
4基于主题相关度和搜索历史的PageRank算法
4.1算法改进的基本思想
4.2主题相关度因子
4.2.1关键字获取
4.2.2相似度计算
4.3搜索历史因子
4.3.1搜索历史数据获取
4.3.2相似度计算
4.4 THPR算法描述
4.5本章小结
5实验系统搭建与实现
5.1系统结构
5.2功能模块介绍
5.2.1网页抓取模块
5.2.2网页预处理
5.2.3查询模块
5.3实验步骤
5.4 实验方案
5.4.1用户满意度指标
5.4.2评价指标
5.5算法评测
5.5.1用户满意度评测
5.5.2评价指标评估
5.6 本章小结
6结论与展望
6.1结论
6.2展望
参考文献
个人简介
致谢
浙江农林大学;