首页> 外文会议>Advances in information retrieval theory >Modeling the Score Distributions of Relevant and Non-relevant Documents
【24h】

Modeling the Score Distributions of Relevant and Non-relevant Documents

机译:相关和不相关文档的分数分布建模

获取原文
获取原文并翻译 | 示例

摘要

Empirical modeling of the score distributions associated with retrieved documents is an essential task for many retrieval applications. In this work, we propose modeling the relevant documents' scores by a mixture of Gaussians and modeling the non-relevant scores by a Gamma distribution. Applying variational inference we automatically trade-off the goodness-of-fit with the complexity of the model. We test our model on traditional retrieval functions and actual search engines submitted to TREC. We demonstrate the utility of our model in inferring precision-recall curves. In all experiments our model outperforms the dominant exponential-Gaussian model.
机译:与检索到的文档相关联的分数分布的经验模型是许多检索应用程序的基本任务。在这项工作中,我们建议通过混合高斯模型对相关文档的分数进行建模,并通过Gamma分布对不相关的分数进行建模。应用变分推论,我们自动权衡拟合优度与模型的复杂性。我们在传统检索功能和提交给TREC的实际搜索引擎上测试了我们的模型。我们演示了我们的模型在推断精确召回曲线中的实用性。在所有实验中,我们的模型均优于优势指数高斯模型。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号