首页> 中国专利> 术语标准化方法、系统及相应设备和存储介质

术语标准化方法、系统及相应设备和存储介质

摘要

本申请公开了术语标准化方法、系统及相应设备和存储介质,其中所述方法包括:对每一标准术语进行分词和词性标注以及进行实体识别;根据每一标准术语分别生成第一参考文本空间向量,其中实体识别结果包含词语类型标签;根据第一参考文本空间向量构建向量搜索模型;对待标准化的术语进行分词和词性标注以及进行实体识别;生成待标准化文本空间向量;从向量搜索模型搜索相似度最高的M个参考文本空间向量;计算每一词语类型标签维度的相似度;计算总相似度;将总相似度最高的参考文本空间向量对应的标准术语作为待标准化的术语的标准术语。本发明既能确保召回率,又能提高匹配准确度。

著录项

  • 公开/公告号CN112307763B

    专利类型发明专利

  • 公开/公告日2021-04-06

    原文格式PDF

  • 申请/专利权人 望海康信(北京)科技股份公司;

    申请/专利号CN202011601761.4

  • 申请日2020-12-30

  • 分类号G06F40/289(20200101);G06F40/295(20200101);G06F40/247(20200101);G06K9/62(20060101);

  • 代理机构11224 北京金阙华进专利事务所(普通合伙);

  • 代理人陈建春;吴召玲

  • 地址 100176 北京市大兴区北京经济技术开发区荣华中路22号院3号楼8层801-2

  • 入库时间 2022-08-23 11:37:44

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号