首页> 中国专利> 一种融入先验知识的短文本相似度计算方法

一种融入先验知识的短文本相似度计算方法

摘要

本发明公开了一种融入先验知识的短文本相似度计算方法,包括如下步骤:S10、构建关键词字典;S20、对训练数据增加关键词标注;S30、对增加关键词标注的训练数据通过BERT模型训练,并保存最优结果;S40、对用户输入的query进行文本纠错;S50、对纠错后query和待匹配的question进行关键词提取,以及依存句法分析;S60、对步骤S50中的分析结果构建模型输入,并输入至训练好的BERT模型,以获得文本相似度。本发明对训练数据增加关键词和依存句法分析标注,给模型增加更多的先验知识,加快收敛速度。

著录项

  • 公开/公告号CN114444490A

    专利类型发明专利

  • 公开/公告日2022-05-06

    原文格式PDF

  • 申请/专利权人 重庆长安汽车股份有限公司;

    申请/专利号CN202210114645.2

  • 发明设计人 杨稷;

    申请日2022-01-30

  • 分类号G06F40/279;G06F40/242;G06F40/216;

  • 代理机构

  • 代理人

  • 地址 400020 重庆市江北区建新东路260号

  • 入库时间 2023-06-19 15:11:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-06

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号