首页> 中国专利> 基于无监督学习的文本相似度计算方法、系统、设备及介质

基于无监督学习的文本相似度计算方法、系统、设备及介质

摘要

本发明公开了一种基于无监督学习的文本相似度计算方法、系统、设备及介质,所述方法包括:获取训练集,将训练集中的每篇文本作为摘要生成网络的输入,得到每篇文本对应的摘要,构成文本集合与摘要集合;搭建相似度计算网络;采用文本集合和摘要集合对相似度计算网络进行训练;将待处理的两篇文本输入训练后的相似度计算网络,输出这两篇文本的相似度。本发明无需人工标记的配对数据就可以进行训练与学习,大大降低了数据获取的成本。

著录项

  • 公开/公告号CN109977194B

    专利类型发明专利

  • 公开/公告日2021-08-10

    原文格式PDF

  • 申请/专利权人 华南理工大学;

    申请/专利号CN201910211396.7

  • 发明设计人 庄浩杰;王聪;孙庆华;

    申请日2019-03-20

  • 分类号G06F16/33(20190101);G06F16/34(20190101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人李君

  • 地址 510640 广东省广州市天河区五山路381号

  • 入库时间 2022-08-23 12:17:10

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号