首页> 中国专利> 一种多领域与多学科科技政策资源检索方法及装置

一种多领域与多学科科技政策资源检索方法及装置

摘要

本发明提供一种多领域与多学科科技政策资源检索方法及装置,通过传统的预设相关性计算模型计算用户查询和各科技政策资源文本段的相似度并初步召回和粗排候选文档,再进一步引用深度语言模型BERT对初步召回的候选文档进行修正和重排以最终输出查询结果。基于无标注的文本对BERT模型进行预训练,并采用特定领域有标注的文本进行微调,提高了文本匹配任务完成过程中的语义捕获能力。通过分割候选文本为多个文本段,分别计算各文本段与用户查询之间的相似度后进行聚合得到第二相关性分数,以解决BERT模型输入限制的问题。本发明通过两阶段的查询检索,综合词汇、词义和结构层面的特征,提升了文本匹配的精度。

著录项

  • 公开/公告号CN115344668A

    专利类型发明专利

  • 公开/公告日2022-11-15

    原文格式PDF

  • 申请/专利权人 北京邮电大学;

    申请/专利号CN202210846693.0

  • 申请日2022-07-05

  • 分类号G06F16/33;G06N3/04;G06N3/08;

  • 代理机构北京金咨知识产权代理有限公司;

  • 代理人薛海波

  • 地址 100876 北京市海淀区西土城路10号

  • 入库时间 2023-06-19 17:35:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号