查询扩展
查询扩展的相关文献在1999年到2022年内共计400篇,主要集中在自动化技术、计算机技术、科学、科学研究、无线电电子学、电信技术
等领域,其中期刊论文342篇、会议论文24篇、专利文献51963篇;相关期刊118种,包括情报学报、情报杂志、现代图书情报技术等;
相关会议19种,包括2011年中国自动化大会暨钱学森诞辰一百周年及中国自动化学会五十周年会庆、第五届全国青年计算语言学研讨会(YWCL 2010)、第六届全国信息检索学术会议等;查询扩展的相关文献由798位作者贡献,包括黄名选、张师超、林鸿飞等。
查询扩展—发文量
专利文献>
论文:51963篇
占比:99.30%
总计:52329篇
查询扩展
-研究学者
- 黄名选
- 张师超
- 林鸿飞
- 王明文
- 严小卫
- 万常选
- 余正涛
- 张斌
- 林原
- 蒋曹清
- 冯平
- 孙达明
- 李卫疆
- 甘丽新
- 陈燕红
- 周栋
- 张书波
- 徐博
- 拉利特什·卡特拉嘎达
- 王旭阳
- 王锋
- 皮尤什·普拉拉德卡
- 维内特·古普塔
- 陈治平
- 于超
- 伍璇
- 何丕廉
- 刘宗田
- 孙四明
- 左家莉
- 年梅
- 张兰芳
- 张峰
- 张引
- 施水才
- 曾利军
- 李力沛
- 李弼程
- 杜军平
- 杨静
- 涂伟
- 王健
- 王斌
- 王琳
- 王瑞琴
- 王璐
- 王秀娟
- 罗颖
- 许侃
- 贺宏朝
-
-
陈高荣;
徐建
-
-
摘要:
专利检索是专利挖掘任务的重要前置子任务,而查询扩展对于提高专利检索方法的准确率和召回率有重要作用。专利文档具有高频率的非标准技术术语以及创造词的特点,传统的查询扩展方法并没有考虑这一特点,会导致专利检索子任务难以获取用户完整的查询意图;此外,在专利查询扩展过程中不可避免地会引入噪声词,出现主题漂移现象,导致查询召回率降低。为了解决这些问题,提出了一种基于社区发现的专利查询扩展方法,该方法建立以专利主题词为节点,主题词之间关系为边的专利主题词图,将专利查询扩展问题转化稠密子图搜索问题,利用社区发现算法实现问题求解。在基准数据集CLEP-IP 2010上开展实验,结果表明与现有的专利扩展查询方法相比,与基准方法相比召回率提高了约7.1%,PRES改善了近3.2%。
-
-
黄名选;
胡小春
-
-
摘要:
本文提出一种深度学习与关联模式挖掘融合的查询扩展模型.该模型采用基于Copulas函数的支持度-置信度评价框架挖掘初检伪相关反馈文档集中扩展词,构建统计扩展词集,利用深度学习工具对初检文档集进行词向量语义学习训练得到词向量扩展词集,将统计扩展词集和词向量扩展词集融合得到最终扩展词.该模型不仅考虑来自统计分析与挖掘的扩展词与原查询间的关联信息,还考虑扩展词在文档中的上下文语义信息,扩展词质量得到较好地改善.在NTCIR-5 CLIR语料的实验结果表明,本文扩展模型能提高信息检索性能,其MAP和P@5平均增幅高于近年现有同类查询扩展方法.本文扩展模型可用于跨语言检索系统,以提高其性能.
-
-
卢卓君
-
-
摘要:
针对当前文档间关联性弱、文档数据和其他数据相互隔离、传统文档检索方式单一等问题,提出了文档知识图谱构建及其智能检索的方法。方法围绕文档类型、文档结构、文档关系3个要素,利用知识图谱技术,采用自顶向下构建模式层和自底向上构建数据层相结合的方式,将无结构化的文档转化为文档知识图谱,并结合知识融合技术将文档知识与其他知识进行融合,最终形成融合的文档知识图谱,并在此数据结构上进行智能检索。为了使检索结果更加准确和智能,文本中使用命名体识别技术建模用户查询意图,并提出基于文档知识图谱表示学习的查询扩展模型。最后在开源数据集ESR上进行对比实验,验证了本文提出的方法的有效性。
-
-
黄名选;
胡小春
-
-
摘要:
将Copulas理论引入文本特征词关联模式挖掘,提出融合Copulas理论和关联规则挖掘的查询扩展算法.从初检文档集中提取前列n篇文档构建伪相关反馈文档集或用户相关反馈文档集,利用基于Copulas理论的支持度和置信度对相关反馈文档集挖掘含有原查询词项的特征词频繁项集和关联规则模式,从这些规则模式中提取扩展词,实现查询扩展.在NTCIR-5 CLIR中英文本语料上的实验表明,文中算法可有效遏制查询主题漂移和词不匹配问题,改善信息检索性能,提升扩展词质量,减少无效扩展词.
-
-
黄名选;
蒋曹清;
卢守东
-
-
摘要:
【目的】针对信息检索中词不匹配问题,提出一种词嵌入与扩展词交集融合的查询扩展模型。【方法】对初检文档集进行词嵌入学习训练和关联规则挖掘,分别得到词嵌入候选扩展词集和挖掘候选扩展词集,将这两种候选扩展词集进行交集融合得到最终扩展词集,实现查询扩展。【结果】实验结果表明,所提扩展模型检索结果MAP和P@5高于基准检索,与近年同类查询扩展方法比较,其MAP和P@5平均增幅范围分别为0.96%~31.24%和1.07%~13.55%。【局限】只进行实验性研究,需要继续探讨在实际信息检索系统中的具体应用。【结论】所提模型能提高扩展词质量,改善检索性能,遏制查询主题漂移和词不匹配问题。
-
-
黄名选
-
-
摘要:
针对自然语言处理中查询主题漂移和词不匹配问题,提出基于CSC(Copulas-based Support and Confidence)框架的关联模式挖掘与规则扩展算法,并将基于统计学分析的关联模式与具有上下文语义信息的词向量融合,提出关联模式挖掘与词向量学习融合的伪相关反馈查询扩展模型.该模型对伪相关反馈文档集挖掘规则扩展词,对初检文档集进行词嵌入学习训练得到词向量,计算规则扩展词与原查询的向量相似度,提取向量相似度不低于阈值的规则扩展词作为最终扩展词.实验结果表明,所提扩展模型能有效地减少查询主题漂移和词不匹配问题,提高检索性能,与现有基于关联模式的和基于词向量的查询扩展方法比较,MAP(Mean Average Precision)平均增幅最大可达17.52%,对短查询更有效.所提挖掘方法可用于其他文本挖掘任务和推荐系统,以提高其性能.
-
-
黄名选;
蒋曹清;
卢守东
-
-
摘要:
[目的]针对信息检索中词不匹配问题,提出一种词嵌入与扩展词交集融合的查询扩展模型.[方法]对初检文档集进行词嵌入学习训练和关联规则挖掘,分别得到词嵌入候选扩展词集和挖掘候选扩展词集,将这两种候选扩展词集进行交集融合得到最终扩展词集,实现查询扩展.[结果]实验结果表明,所提扩展模型.检索结果MAP和P@5高于基准检索,与近年同类查询扩展方法比较,其MAP和P@5平均增幅范围分别为0.96%~31.24%和1.07%~13.55%.[局限]只进行实验性研究,需要继续探讨在实际信息检索系统中的具体应用.[结论]所提模型能提高扩展词质量,改善检索性能,遏制查询主题漂移和词不匹配问题.
-
-
-
刘高军;
方晓;
段建勇
-
-
摘要:
随着互联网时代的到来,搜索引擎开始被普遍使用.在针对冷门数据时,由于用户的搜索词范围过小,搜索引擎无法检索出需要的数据,此时查询扩展系统可以有效辅助搜索引擎来提供可靠服务.基于全局文档分析的查询扩展方法,提出结合神经网络模型与包含语义信息的语料的语义相关模型,来更深层地提取词语间的语义信息.这些深层语义信息可以为查询扩展系统提供更加全面有效的特征支持,从而分析词语间的可扩展关系.在近义词林、语言知识库"HowNet"义原标注信息等语义数据中抽取局部可扩展词分布,利用神经网络模型的深度挖掘能力将语料空间中每一个词语的局部可扩展词分布拟合成全局可扩展词分布.在与分别基于语言模型和近义词林的查询扩展方法对比实验中,使用基于语义相关模型的查询扩展方法拥有较高的查询扩展效率;尤其针对冷门搜索数据时,语义相关模型的查全率比对比方法分别提高了11.1个百分点与5.29个百分点.
-
-
兰慧红
-
-
摘要:
针对传统跨语言查询扩展方法中存在的问题,提出一种基于用户兴趣模型的个性化跨语言查询扩展方法.该方法利用用户的历史浏览日志信息建立用户兴趣模型,在该模型基础上对初始检索结果进行分析,将初始检索结果文档中与用户兴趣相关度较大的文档作为查询扩展的依据,使扩展后得到的查询关键词更能表达用户的个性化需求.在真实用户搜索日志数据上的实验结果表明,本文算法能更好地满足用户的个性化需求,有效地改善和提高跨语言信息检索的准确率,与未经过个性化查询扩展的跨语言信息检索及现有算法比较,其实验结果的MAP、P@5、P@10值都得到了提高,提高幅度最大可达26.51%.
-
-
-
-
-
-
钟敏娟;
万常选
- 《第27届中国数据库学术会议》
| 2010年
-
摘要:
伪反馈一直以来都被认为是一种有效的查询扩展技术。但是近来的研究表明传统的伪反馈容易带来主题漂移并因此而影响检索性能。如何确定相关文档以及如何从相关文档中挑选有用的扩展词项是伪反馈中两个重要的方面。与传统查询扩展不同,XML查询扩展不仅需要内容扩展还需要考虑结构扩展。提出了一个解决框架,利用聚类和词组抽取技术来查找相关文档和选择有用的扩展信息。结合XML的语义特征,提出了一种全新的基于层次信息的文档相似性度量方案。基于此,将初始检索结果聚类,获得与查询请求最为相关的文档簇,然后在文档簇中抽取词组,找到符合用户查询意图的扩展查询词组,并在扩展查询词组的基础上进行结构扩展,最终形成完整的"内容+结构"的查询扩展表达式。IEEE CS实验数据上的实验结果表明,结合了聚类和抽取技术的XML伪反馈查询扩展方法能有效地降低主题漂移现象,获得更好的检索质量。
-
-
- 《第四届全国信息检索与内容安全学术会议》
| 2008年
-
摘要:
在信息检索领域,针对相关文档和用户查询之间的词不匹配问题,相关反馈和查询扩展可以有效提高检索性能.近来学者们将单词之问的关联关系融入到统计语言模型中,但都是利用WordNet或共现关系进行查询扩展,前者效果不明显而后者易引入很多"噪音".本文提出一种基于局部词语搭配关系的查询扩展方法,即从前N篇相关文档中反馈具有句法和语义关系的搭配单词加入原查询.在TREC数据集的试验结果表明:本文提出的基于词语搭配关系的查询扩展方法不仅比传统语言模型方法性能有很大的提高.而且也优于目前流行的查询扩展方法.
-
-
Wenxin Yin;
尹文昕;
Yue Zhang;
张跃;
Xian Sun;
孙显;
Kun Fu;
付琨
- 《第五届高分辨率对地观测学术年会》
| 2018年
-
摘要:
近年来,随着海量高分辨率遥感图像快速积累,亟需高效的遥感图像检索系统.为提升遥感图像检索的性能,本文对基于深度特征的高分辨率遥感图像检索展开研究,提出了一种基于深度融合特征的遥感图像检索方法.首先,基于当前复杂遥感场景下单一特征表示能力不足的问题,提出了一种基于深度网络的遥感图像特征均值-最大池化加权融合的方法.其次,基于该融合方法,构建了一套完整的遥感图像检索的系统框架.该系统框架结合了数据集特征增强、查询扩展等检索方法,进一步提升了遥感图像检索性能.最后,为了训练有效的深度网络,基于当今遥感图像检索数据集数量比较稀缺、常见数据集体量较小且场景较单一的现状,本文构建了一个场景丰富、体量较大的高分辨率遥感图像数据集.实验表明,该方法能够有效地提升深度特征在遥感图像中的检索效果.
-
-
- 《全国Web信息系统及其应用学术会议、全国语义Web与本体论学术研讨会暨全国电子政务技术与应用学术研讨会》
| 2008年
-
摘要:
针对中文实体关系抽取的难点问题,本文在原有的基于Bootstrapping思想进行实体关系抽取的方法上进行了改进.一方面提出了使用《同义词词林》作为计算词语语义相似度的工具,从而获取更多的与种子词相似语义关系的特征词;另一方面通过自学习种子集合不断扩展,并利用最终得到的种子信息获取正例.然后使用查询扩展技术从这些正例中生成查询,通过这些查询可以从大量的文本数据库中检索出潜在的文档,减少了抽取的时间.实验结果表明,该方法能够有效地抽取出实体关系,并且有较高的召回率和准确率。
-
-