首页> 中文学位 >信息检索查询性能预测
【6h】

信息检索查询性能预测

代理获取

目录

声明

摘要

第一章 引言

1.1 研究背景

1.2 查询性能预测研究的意义

1.3 国内外现状及发展趋势

1.4 本文的主要研究内容

1.5 本文的组织结构

第二章 信息检索的相关理论

2.1 信息检索中的基本概念

2.2 经典信息检索模型

2.2.1 布尔模型

2.2.2 向量模型

2.2.3 概率模型

2.3 信息检索中的性能评价指标

2.3.1 精度和召回率

2.3.2 前n平均精度:P@n

2.3.3 平均精度均值

2.3.4 R精度

2.3.5 排序相关性测度

2.4 影响信息检索查询性能的因素

2.5 本章小结

第三章 查询性能预测的基本方法

3.1 检索前预测方法

3.2 检索后预测方法

3.2.1 清晰度

3.2.2 鲁棒性

3.2.3 得分分布

3.3 本章小结

第四章 基于得分量度和差异的查询性能预测

4.1 基本原理

4.2 假设的提出

4.3 模型框架的建立

4.4 截断参数k值的讨论

4.5 实验设计与结果分析

4.5.1 测试集与参数的设置

4.5.2 实验结果与数据分析

4.6 本章小结

第五章 检索前查询性能预测

5.1 基本原理

5.2 检索前查询性能预测方法

5.3 K1,K2,K3查询性能预测算法的主要步骤

5.3.1 数据集预处理

5.3.2 求解K1,K2,K3

5.3.3 求解K1,K2,K3的伪代码实现

5.4 实验与结果分析

5.5 本章小结

第六章 总结与展望

6.1 本文总结

6.2 展望

参考文献

致谢

在学期间发表的学术论文及其他科研成果

展开▼

摘要

查询性能预测的目的是为了在缺少相关性判断信息的条件下评估一个检索系统针对于一个特定的查询返回的结果的有效性。查询性能预测在信息检索领域有着许多的应用,如查询优化,提高检索的一致性和分布式信息检索。这就是近几年这个问题在信息检索领域受到相当大的关注的原因。查询性能预测也被称为查询困难度预测。
  查询性能预测方法大致可以分为两大类:检索前预测方法和检索后预测方法。检索前预测方法在查询提交给检索系统之前预测查询的性能,它们主要使用了在索引阶段收集到的查询词项的统计学特征。因此,这类方法通常计算非常快速,但是一般没有检索后预测方法准确。检索后预测方法在查询提交给检索系统获得查询结果列表之后预测查询的性能。这类方法通常更加复杂,因为需要分析检索后的结果文档。
  针对近几年的查询性能预测研究,论文主要做了如下工作:
  (1)论文提出了一种综合考虑排序结果列表得分量度和差异度的SMV方法来评估查询的性能。实验中使用了6个不同的TREC测试集,并将SMV查询性能预测方法与3种先进的预测算法进行了比较。实验结果表明SMV查询性能预测方法非常地有竞争力。与其他3种查询性能预测算法采用两两对比的方式,SMV预测算法在更多的数据集上预测效果表现地更好。
  (2)针对许多基于得分分布的预测算法都需要提前设定一个固定的k值的情形,论文提出了一种动态选取截断参数k值的方法。这种方法可以根据不同的查询设置不同的k值。
  (3)论文提出了3种基于检索前的查询性能预测算法,同时使用了3种检索前方法与之进行了对比实验。实验结果显示,相对于原先的3种预测方法,本文提出的方法性能要好一些。
  目前,查询性能预测已经被认为是信息检索系统最重要的功能之一。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号