首页> 中国专利> 一种基于语义分析的中文句子相似度计算方法和系统

一种基于语义分析的中文句子相似度计算方法和系统

摘要

本发明公开了一种基于语义分析的中文句子相似度计算方法及系统,其中涉及的一种基于语义分析的中文句子相似度计算方法,包括:S1.获取待处理的句子对,并基于预构建的语料库分别对获取的句子对进行分词;其中,预构建的语料库包括行业语料库和普通语料库;S2.对分词后句子的成分进行划分,得到句子的主要成分和次要成分,通过BERT方法和Word2vec方法将句子的主要成分、次要成分均转化为词向量,并使用余弦相似度分别计算句子对的主要成分、次要成分的相似度;S3.根据得到的主要成分、次要成分的相似度,分别计算BERT方法和Word2vec方法的句子对整体相似度,并根据句子对的整体相似度计算句子对的最终相似度。

著录项

  • 公开/公告号CN113392630A

    专利类型发明专利

  • 公开/公告日2021-09-14

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN202110747767.0

  • 发明设计人 季白杨;李辰杰;

    申请日2021-07-01

  • 分类号G06F40/211(20200101);G06F40/284(20200101);G06F40/30(20200101);G06K9/62(20060101);

  • 代理机构33246 浙江千克知识产权代理有限公司;

  • 代理人冷红梅

  • 地址 310014 浙江省杭州市下城区潮王路18号

  • 入库时间 2023-06-19 12:35:33

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号