首页> 中国专利> 基于语义的短文本相似度计算方法

基于语义的短文本相似度计算方法

摘要

本发明公开了一种基于语义的短文本相似度计算方法。其包括语料库数据预处理并建立词语Embedding,构建词语语义树,计算短文本中词语之间的语义相似度,计算短文本之间的语义相似度。本发明以深度学习的词语Embedding为基础,结合分层聚类方法创建词语语义树,计算短文本中词语之间的相似度,并且在此基础上结合短文本的多种特征,计算短文本之间的语义相似度,有效解决了现有技术中词语语义树不能刻画新鲜词语与已知词语语义关系的缺点。

著录项

  • 公开/公告号CN106372061B

    专利类型发明专利

  • 公开/公告日2020-11-24

    原文格式PDF

  • 申请/专利权人 电子科技大学;

    申请/专利号CN201610817910.8

  • 发明设计人 费高雷;胡馨月;胡光岷;

    申请日2016-09-12

  • 分类号G06F40/30(20200101);G06F40/194(20200101);G06F16/35(20190101);

  • 代理机构51268 成都虹盛汇泉专利代理有限公司;

  • 代理人王伟

  • 地址 611731 四川省成都市高新区(西区)西源大道2006号

  • 入库时间 2022-08-23 11:22:28

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号