首页> 中国专利> 查询词嵌入扩展词和统计扩展词并集的中文查询扩展方法

查询词嵌入扩展词和统计扩展词并集的中文查询扩展方法

摘要

本发明提出了一种查询词嵌入扩展词和统计扩展词并集的中文查询扩展方法,其利用深度学习工具对对初检文档集进行词嵌入语义学习训练,得到词向量集,计算每个查询词项与所有非查询词项的向量余弦相似度并降序排列,提取前列非查询词项作为查询词项词嵌入扩展词,得到查询词项词嵌入扩展词集,然后利用基于Copulas理论的统计扩展词挖掘方法对伪相关反馈文档集挖掘统计扩展词,建立统计扩展词集,最后将查询词项词嵌入扩展词集和统计扩展词集进行并集得到最终扩展词,最终扩展词和原查询组合为新查询,再次检索文档集,实现查询扩展。本发明将查询词嵌入扩展词和统计扩展词并集融合,能挖掘出与原查询相关的高质量扩展词,提高和改善文本信息检索性能。

著录项

  • 公开/公告号CN111897928A

    专利类型发明专利

  • 公开/公告日2020-11-06

    原文格式PDF

  • 申请/专利权人 广西财经学院;

    申请/专利号CN202010774442.7

  • 发明设计人 黄名选;

    申请日2020-08-04

  • 分类号G06F16/33(20190101);G06F16/332(20190101);

  • 代理机构45106 广西南宁明智专利商标代理有限责任公司;

  • 代理人林兴宁

  • 地址 530007 广西壮族自治区南宁市西乡塘区大学西路189号

  • 入库时间 2023-06-19 08:00:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-17

    发明专利申请公布后的撤回 IPC(主分类):G06F16/33 专利申请号:2020107744427 申请公布日:20201106

    发明专利申请公布后的撤回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号