信息检索中的带权邻近度度量研究

薛源海; 俞晓明; 刘悦; 关峰; 程学旗

首页> 中文期刊> 《计算机研究与发展》 >信息检索中的带权邻近度度量研究

信息检索中的带权邻近度度量研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.

著录项

来源
《计算机研究与发展》 |2014年第10期|2216-2224|共9页
作者
薛源海; 俞晓明; 刘悦; 关峰; 程学旗;
展开▼
作者单位

中国科学院网络数据科学与技术重点实验室北京 100190;

中国科学院计算技术研究所北京 100190;

中国科学院大学北京100190;

中国科学院网络数据科学与技术重点实验室北京 100190;

中国科学院计算技术研究所北京 100190;

中国科学院网络数据科学与技术重点实验室北京 100190;

中国科学院计算技术研究所北京 100190;

中国科学院网络数据科学与技术重点实验室北京 100190;

中国科学院计算技术研究所北京 100190;

中国科学院大学北京100190;

中国科学院网络数据科学与技术重点实验室北京 100190;

中国科学院计算技术研究所北京 100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
带权邻近度; 度量方法; BM25; 查询词重要性; 信息检索;

相似文献

中文文献
外文文献
专利

1. 带权Bernstein基的对偶泛函在时序相似性度量中的应用 [J] . 钟绍军 ,刘洪 . 统计与信息论坛 . 2015,第003期
2. 带权相似度度量方法及其在光谱异常判定中的应用 [J] . 唐天彪 ,杨辉华 ,梁晓智 . 桂林电子科技大学学报 . 2012,第005期
3. 带权图的多重分形度量 [J] . 刘胜久 ,李天瑞 ,谢鹏 . 计算机科学 . 2021,第003期
4. 带权超网络的度量方法及其性质 [J] . 刘胜久 ,李天瑞 ,杨宗霖 . 计算机应用 . 2019,第011期
5. 多媒体信息检索的有效性度量方法研究 [J] . 朱爱红 ,李连 . 新世纪图书馆 . 2003,第005期
6. PPP模式下区域开发项目政企双方控制权份额的度量方法研究 [C] . WU Di ,伍迪 ,WANG Shou-qing . 第十一届中国软科学学术年会 . 2015
7. 汉语词语语义相似度度量及其在跨语言信息检索中的应用研究 [A] . 彭琳 . 2010

信息检索中的带权邻近度度量研究

摘要

著录项

相似文献

相关主题

期刊订阅