首页> 中国专利> 结合词聚合与词组合语义特征的文本相似性度量方法

结合词聚合与词组合语义特征的文本相似性度量方法

摘要

本发明涉及结合文本集词聚合与词组合分布式语义特征的文本相似性度量方法,属于自然语言处理与机器学习领域。本方法首先联合文本集中词聚合、词组合分布式语义特征进行自编码填词预测,通过自编码的训练过程建立词嵌入编码网络;然后通过词嵌入编码网络构建词嵌入表示,再计算词嵌入的最大加权匹配作为文本相似性度量。本发明具有准确度高、分布式语义特征丰富的特点。构建的词嵌入编码网络可以有效利用词语的语义联系,建立分布式语义信息更加丰富的词嵌入表示,更好的描述词语之间的语义相似性,进一步提升文本相似性度量的准确性。

著录项

  • 公开/公告号CN108399163B

    专利类型发明专利

  • 公开/公告日2021-01-12

    原文格式PDF

  • 申请/专利权人 北京理工大学;

    申请/专利号CN201810234539.1

  • 申请日2018-03-21

  • 分类号G06F40/242(20200101);G06F40/30(20200101);G06F40/216(20200101);G06F16/35(20190101);G06F16/901(20190101);

  • 代理机构

  • 代理人

  • 地址 100081 北京市海淀区中关村南大街5号

  • 入库时间 2022-08-23 11:28:42

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号