文摘
英文文摘
第一章 绪论
1.1 引言
1.2 研究现状
1.2.1 信息检索中的排序模型
1.2.2 语言模型
1.3 本文主要研究内容
1.3.1 基于多元组的文档-查询相似度算法研究
1.3.2 基于互联网多层次特性的平滑算法研究
1.3.3 基于朴素贝叶斯的文档先验概率估计
1.4 本文组织结构
第二章 相关工作综述
2.1 信息检索
2.1.1 布尔逻辑模型
2.1.2 向量空间模型
2.1.3 概率检索模型
2.1.4 统计语言模型
2.1.5 基于监督学习方法的排序模型
2.2 统计语言模型详述
2.2.1 信息检索中的语言模型
2.3 信息检索评价指标
2.3.1 MAP
2.3.2 rNDCG
第三章 基于互联网特性的文档-查询相似度估计
3.1 引言
3.2 基于多元组的文档-查询相似度算法
3.2.1 查询模型
3.2.2 基于多元组的文档-查询相似度算法
3.3 基于多元组的文档-查询相似度算法性能分析
3.3.1 实验平台简介
3.3.2 实验结果及分析
3.4 基于互联网多层次特性的平滑算法
3.4.1 多层次平滑的意义及模型
3.4.2 多层次数据存储结构及构建算法
3.4.3 基于互联网多层次特性的平滑算法
3.5 基于互联网多层次特性的平滑算法实验与分析
3.5.1 实验设置
3.5.2 实验结果及分析
3.6 基于互联网特性的文档-查询相似度算法实验及分析
第四章 基于朴素贝叶斯的文档先验概率估计
4.1 引言
4.2 文档结构知识与相关性
4.2.1 URL深度
4.2.2 文档长度
4.2.3 Inlinks和Outlinks
4.2.4 PageRank、HITS Authority/Hub
4.3 文档先验知识融合
4.4 实验及分析
4.4.1 原始文档-查询相似度数据
4.4.2 实验及结果分析
第五章 结束语
5.1 本文工作总结
5.2 未来工作展望
参考文献
致谢
个人简历