您现在的位置: 首页> 研究主题> 查询扩展

查询扩展

查询扩展的相关文献在1999年到2022年内共计400篇,主要集中在自动化技术、计算机技术、科学、科学研究、无线电电子学、电信技术 等领域,其中期刊论文342篇、会议论文24篇、专利文献51963篇;相关期刊118种,包括情报学报、情报杂志、现代图书情报技术等; 相关会议19种,包括2011年中国自动化大会暨钱学森诞辰一百周年及中国自动化学会五十周年会庆、第五届全国青年计算语言学研讨会(YWCL 2010)、第六届全国信息检索学术会议等;查询扩展的相关文献由798位作者贡献,包括黄名选、张师超、林鸿飞等。

查询扩展—发文量

期刊论文>

论文:342 占比:0.65%

会议论文>

论文:24 占比:0.05%

专利文献>

论文:51963 占比:99.30%

总计:52329篇

查询扩展—发文趋势图

查询扩展

-研究学者

  • 黄名选
  • 张师超
  • 林鸿飞
  • 王明文
  • 严小卫
  • 万常选
  • 余正涛
  • 张斌
  • 林原
  • 蒋曹清
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 陈高荣; 徐建
    • 摘要: 专利检索是专利挖掘任务的重要前置子任务,而查询扩展对于提高专利检索方法的准确率和召回率有重要作用。专利文档具有高频率的非标准技术术语以及创造词的特点,传统的查询扩展方法并没有考虑这一特点,会导致专利检索子任务难以获取用户完整的查询意图;此外,在专利查询扩展过程中不可避免地会引入噪声词,出现主题漂移现象,导致查询召回率降低。为了解决这些问题,提出了一种基于社区发现的专利查询扩展方法,该方法建立以专利主题词为节点,主题词之间关系为边的专利主题词图,将专利查询扩展问题转化稠密子图搜索问题,利用社区发现算法实现问题求解。在基准数据集CLEP-IP 2010上开展实验,结果表明与现有的专利扩展查询方法相比,与基准方法相比召回率提高了约7.1%,PRES改善了近3.2%。
    • 黄名选; 胡小春
    • 摘要: 本文提出一种深度学习与关联模式挖掘融合的查询扩展模型.该模型采用基于Copulas函数的支持度-置信度评价框架挖掘初检伪相关反馈文档集中扩展词,构建统计扩展词集,利用深度学习工具对初检文档集进行词向量语义学习训练得到词向量扩展词集,将统计扩展词集和词向量扩展词集融合得到最终扩展词.该模型不仅考虑来自统计分析与挖掘的扩展词与原查询间的关联信息,还考虑扩展词在文档中的上下文语义信息,扩展词质量得到较好地改善.在NTCIR-5 CLIR语料的实验结果表明,本文扩展模型能提高信息检索性能,其MAP和P@5平均增幅高于近年现有同类查询扩展方法.本文扩展模型可用于跨语言检索系统,以提高其性能.
    • 卢卓君
    • 摘要: 针对当前文档间关联性弱、文档数据和其他数据相互隔离、传统文档检索方式单一等问题,提出了文档知识图谱构建及其智能检索的方法。方法围绕文档类型、文档结构、文档关系3个要素,利用知识图谱技术,采用自顶向下构建模式层和自底向上构建数据层相结合的方式,将无结构化的文档转化为文档知识图谱,并结合知识融合技术将文档知识与其他知识进行融合,最终形成融合的文档知识图谱,并在此数据结构上进行智能检索。为了使检索结果更加准确和智能,文本中使用命名体识别技术建模用户查询意图,并提出基于文档知识图谱表示学习的查询扩展模型。最后在开源数据集ESR上进行对比实验,验证了本文提出的方法的有效性。
    • 黄名选; 胡小春
    • 摘要: 将Copulas理论引入文本特征词关联模式挖掘,提出融合Copulas理论和关联规则挖掘的查询扩展算法.从初检文档集中提取前列n篇文档构建伪相关反馈文档集或用户相关反馈文档集,利用基于Copulas理论的支持度和置信度对相关反馈文档集挖掘含有原查询词项的特征词频繁项集和关联规则模式,从这些规则模式中提取扩展词,实现查询扩展.在NTCIR-5 CLIR中英文本语料上的实验表明,文中算法可有效遏制查询主题漂移和词不匹配问题,改善信息检索性能,提升扩展词质量,减少无效扩展词.
    • 黄名选; 蒋曹清; 卢守东
    • 摘要: 【目的】针对信息检索中词不匹配问题,提出一种词嵌入与扩展词交集融合的查询扩展模型。【方法】对初检文档集进行词嵌入学习训练和关联规则挖掘,分别得到词嵌入候选扩展词集和挖掘候选扩展词集,将这两种候选扩展词集进行交集融合得到最终扩展词集,实现查询扩展。【结果】实验结果表明,所提扩展模型检索结果MAP和P@5高于基准检索,与近年同类查询扩展方法比较,其MAP和P@5平均增幅范围分别为0.96%~31.24%和1.07%~13.55%。【局限】只进行实验性研究,需要继续探讨在实际信息检索系统中的具体应用。【结论】所提模型能提高扩展词质量,改善检索性能,遏制查询主题漂移和词不匹配问题。
    • 黄名选
    • 摘要: 针对自然语言处理中查询主题漂移和词不匹配问题,提出基于CSC(Copulas-based Support and Confidence)框架的关联模式挖掘与规则扩展算法,并将基于统计学分析的关联模式与具有上下文语义信息的词向量融合,提出关联模式挖掘与词向量学习融合的伪相关反馈查询扩展模型.该模型对伪相关反馈文档集挖掘规则扩展词,对初检文档集进行词嵌入学习训练得到词向量,计算规则扩展词与原查询的向量相似度,提取向量相似度不低于阈值的规则扩展词作为最终扩展词.实验结果表明,所提扩展模型能有效地减少查询主题漂移和词不匹配问题,提高检索性能,与现有基于关联模式的和基于词向量的查询扩展方法比较,MAP(Mean Average Precision)平均增幅最大可达17.52%,对短查询更有效.所提挖掘方法可用于其他文本挖掘任务和推荐系统,以提高其性能.
    • 黄名选; 蒋曹清; 卢守东
    • 摘要: [目的]针对信息检索中词不匹配问题,提出一种词嵌入与扩展词交集融合的查询扩展模型.[方法]对初检文档集进行词嵌入学习训练和关联规则挖掘,分别得到词嵌入候选扩展词集和挖掘候选扩展词集,将这两种候选扩展词集进行交集融合得到最终扩展词集,实现查询扩展.[结果]实验结果表明,所提扩展模型.检索结果MAP和P@5高于基准检索,与近年同类查询扩展方法比较,其MAP和P@5平均增幅范围分别为0.96%~31.24%和1.07%~13.55%.[局限]只进行实验性研究,需要继续探讨在实际信息检索系统中的具体应用.[结论]所提模型能提高扩展词质量,改善检索性能,遏制查询主题漂移和词不匹配问题.
    • 刘高军; 方晓; 段建勇
    • 摘要: 随着互联网时代的到来,搜索引擎开始被普遍使用.在针对冷门数据时,由于用户的搜索词范围过小,搜索引擎无法检索出需要的数据,此时查询扩展系统可以有效辅助搜索引擎来提供可靠服务.基于全局文档分析的查询扩展方法,提出结合神经网络模型与包含语义信息的语料的语义相关模型,来更深层地提取词语间的语义信息.这些深层语义信息可以为查询扩展系统提供更加全面有效的特征支持,从而分析词语间的可扩展关系.在近义词林、语言知识库"HowNet"义原标注信息等语义数据中抽取局部可扩展词分布,利用神经网络模型的深度挖掘能力将语料空间中每一个词语的局部可扩展词分布拟合成全局可扩展词分布.在与分别基于语言模型和近义词林的查询扩展方法对比实验中,使用基于语义相关模型的查询扩展方法拥有较高的查询扩展效率;尤其针对冷门搜索数据时,语义相关模型的查全率比对比方法分别提高了11.1个百分点与5.29个百分点.
    • 兰慧红
    • 摘要: 针对传统跨语言查询扩展方法中存在的问题,提出一种基于用户兴趣模型的个性化跨语言查询扩展方法.该方法利用用户的历史浏览日志信息建立用户兴趣模型,在该模型基础上对初始检索结果进行分析,将初始检索结果文档中与用户兴趣相关度较大的文档作为查询扩展的依据,使扩展后得到的查询关键词更能表达用户的个性化需求.在真实用户搜索日志数据上的实验结果表明,本文算法能更好地满足用户的个性化需求,有效地改善和提高跨语言信息检索的准确率,与未经过个性化查询扩展的跨语言信息检索及现有算法比较,其实验结果的MAP、P@5、P@10值都得到了提高,提高幅度最大可达26.51%.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号