首页> 中国专利> 文本相似度确定方法、文本处理方法、相应的装置和设备

文本相似度确定方法、文本处理方法、相应的装置和设备

摘要

本申请实施例提供了一种文本相似度确定方法、文本处理方法、相应的装置和设备,该方法采用针对第一分词集合中的每个分词,获取该分词的权重,并且确定该分词到第二分词集合中距离最近的分词的距离,以及针对第二分词集合中的每个分词,获取该分词的权重,并且确定该分词到第一分词集合中距离最近的分词的距离,进而根据第一分词集合中的各个分词对应的权重和对应的距离以及第二分词集合中的各个分词对应的权重和对应的距离,确定第一文本和第二文本的相似度,通过从第一分词集合的角度和第二分词集合的角度联合来确定两个文本间的相似度,并结合表征每个分词重要性的权重,能够显著提高相似度确定结果的准确性。

著录项

  • 公开/公告号CN113988045A

    专利类型发明专利

  • 公开/公告日2022-01-28

    原文格式PDF

  • 申请/专利权人 浙江口碑网络技术有限公司;

    申请/专利号CN202111620649.X

  • 发明设计人 许斯军;田正中;李小可;张俊鹏;

    申请日2021-12-28

  • 分类号G06F40/194(20200101);G06F40/289(20200101);

  • 代理机构44468 深圳市立智方成知识产权代理事务所(普通合伙);

  • 代理人廖娟

  • 地址 310012 浙江省杭州市西湖区西斗门路3号天堂软件园A幢11楼G座

  • 入库时间 2023-06-19 14:01:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-12

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号