首页> 中国专利> 一种基于智能加权分词技术的文本相似度计算方法和系统

一种基于智能加权分词技术的文本相似度计算方法和系统

摘要

本申请提供了一种基于智能加权分词技术的文本相似度计算方法,其中该方法包括:获取第一文本和第二文本;根据所述第一文本和所述第二文本所在领域构建加权词库;对所述第一文本和所述第二文本分别进行分词获得第一分词列表和第二分词列表;将所述加权词库中包含的词从所述第一分词列表和所述第二分词列表中分别剔除以获取第一核心文本和第二核心文本;将所述第一核心文本和所述第二核心文本输入相似度计算模型,以计算所述第一核心文本和所述第二核心文本之间的相似度。

著录项

  • 公开/公告号CN111639496A

    专利类型发明专利

  • 公开/公告日2020-09-08

    原文格式PDF

  • 申请/专利权人 中信银行股份有限公司;

    申请/专利号CN202010399606.2

  • 发明设计人 周丽娟;王晓旭;王乐;

    申请日2020-05-12

  • 分类号G06F40/289(20200101);G06F40/194(20200101);G06F16/31(20190101);

  • 代理机构11354 北京市兰台律师事务所;

  • 代理人张峰

  • 地址 100010 北京市东城区朝阳门北大街9号

  • 入库时间 2023-06-19 08:11:16

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号