基于依存与排序学习技术的冗长查询处理

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

用户一般通过搜索引擎来查询所需信息，而搜索引擎的返回结果很多，每个检索结果并不一定都是符合用户需求的。同时由于教育文化背景的差异，用户即使有相同的查询意图，但其提交的查询词汇也是千差万别。因此，用户输入相同的查询词汇，返回同样的结果并不能令每个用户都满意。在信息检索系统中，一般通过查询扩展技术来提高检索性能。用户通常有时会把自己的详细需求信息全部输入至信息检索系统进行检索，即用户会输入冗长查询。这就给信息检索系统带来了压力，迫使检索系统不断进行改进以满足用户输入的冗长查询的需求。目前以往的搜索引擎在处理冗长查询时性能都会下降，检索结果不能聚焦在查询主题上，返回的信息不能满足用户需求。
　　本文提出了两种冗长查询处理方法:基于依存关系的冗长查询重构模型方法;基于语义与排序学习技术的冗长查询处理方法。基于依存关系的冗长查询重构模型方法区别于基于关键词的处理方式，而是针对冗长查询自身所具有的特征，冗长查询中的词项间具有良好的语法关系。本方法对文档进行依存关系分析，由于依存关系类型很多有些会产生噪音，因此本文对依存关系类型进行了筛选抽取有效关系对，这点达到了缩短查询词的效果，之后对不同的关系对按其在重构模型中的重要程度分配不同的权重，这点达到了重新加权的效果。实验验证了本方法对特别是对低召回率的检索性能的提升作用，MAP和P@N两个评价指标上都有很大提升。基于语义与排序学习技术的冗长查询处理方法。利用文档在不同空间上的分布以及计算其香农距离，并利用排序学习的方法对原始检索结果进行重新排序。这说明排序学习方法能够为冗长查询处理技术提供较大帮助。实验结果表明，对于冗长查询，不能像传统的查询扩展那样认为查询中每个词是相互独立的来看待，要充分利用其特有的依存语义信息才能够对其检索性能进行改进。本文的实验所用的语料均来自公开数据集TREC标准语料，运用多种方式对本文的实验结果进行了评测，实验结果表明本文提出的两种对于冗长查询的处理技术对检索系统性能有了较大的改进。

著录项

作者
姚兰;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科计算机应用技术
授予学位硕士
导师姓名林鸿飞;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
信息查询; 数据挖掘; 语义排序; 程序语言;

相似文献

中文文献
外文文献
专利

1. 基于句法特征的冗长查询处理技术 [J] . 姚兰 ,林鸿飞 ,林原 . 北京大学学报：自然科学版 . 2013,第2期
2. 基于依存关系匹配的长难查询处理 [J] . 张达夫 . 电脑知识与技术 . 2012,第019期
3. 基于依存关系匹配的长难查询处理 [J] . 张达夫 . 电脑知识与技术：学术交流 . 2012,第007期
4. 基于中心/修饰依存重排序模型的短语SMT [J] . 刘水 ,李生 ,赵铁军 . 软件学报 . 2012,第005期
5. 基于高阶词汇依存的短语结构树重排序模型 [J] . 王志国 ,宗成庆 . 软件学报 . 2012,第010期
6. 基于重排序的依存句法分析和语义分析联合学习 [C] . 李鑫鑫 ,王轩 ,姚霖 . 中国人工智能学会第十三届学术年会 . 2009
7. 基于块排序索引的生物序列相似性查询处理技术研究 [A] . 李永光 . 2006

基于依存与排序学习技术的冗长查询处理

目录

摘要

著录项

相似文献

相关主题

期刊订阅