声明
摘要
第一章 绪论
1.1 论文研究背景
1.2 论文研究意义
1.3 研究现状
1.4 论文的主要研究内容
1.5 论文的组织结构
第二章 相关研究技术
2.1 信息检索模型
2.1.1 向量空间模型
2.1.2 经典概率模型
2.1.3 统计语言模型
2.2 向量相似度计算
2.2.1 文档间向量相似度计算
2.2.2 查询与文档的向量相似度计算
2.3 伪相关反馈技术
2.4 文档平滑技术
2.4.2 Dirichlet Prior平滑技术
2.5 信息检索的评价指标
2.6 本章小结
第三章 基于文档相似度的查询词权重调整
3.1 引言
3.2 利用文档相似度调整查询词权重
3.2.1 利用文档相似度的局部反馈
3.2.2 基于查询的选择
3.3 基于文档相似度的伪相关反馈
3.3.2 语言模型下的查询词权重调整(DS_LM)
3.4 实验结果与分析
3.4.1 实验环境与实验数据集
3.4.2 BM25概率模型下的评估
3.4.3 语言模型下的评估
3.4.4 参数敏感度分析
3.5 本章小结
第四章 基于文档相似度的查询扩展
4.1 引言
4.2 基于文档相似度的查询扩展
4.2.1 Rocchio框架下的查询扩展(DS_Rocchio)
4.2.2 基于语言模型的查询扩展(DS_RM3)
4.3 实验分析
4.3.1 实验数据
4.3.2 结合Rocchio的查询扩展
4.3.3 结合RM3的查询扩展
4.3.4 参数分析
4.4 本章小结
第五章 基于文档相似度的信息检索系统实现
5.1 检索模块
5.2 用户交互模块
5.3 本章小结
第六章 总结与展望
6.2 下一步研究工作
参考文献
攻读硕士期间参加的科研项目
致谢