首页> 中国专利> 一种基于自动编码的文本表示学习方法、系统及电子设备

一种基于自动编码的文本表示学习方法、系统及电子设备

摘要

本申请涉及一种基于自动编码的文本表示学习方法、系统及电子设备。该方法包括:步骤a:使用编码器对原始文本进行编码,生成原始文本编码后的向量表达,并通过编码矩阵输出编码后的文本;步骤b:随机删除所述原始文本中的词,并将被删除的词的词向量置0,将未被删除的词使用预训练好的词向量表示,得到新的文本;步骤c:将所述编码后的文本与新的文本输入到解码器中,并通过解码矩阵预测所述被删除的在时间片t的待预测词的向量表达。本申请采用字谜游戏的方法,结合基于神经网络的自动编码机制,生成给定文本更精确的向量表达。实验结果表明,本申请能提高文本分类、信息抽取等自然语言任务的准确率,改进自然语言处理任务的效果。

著录项

  • 公开/公告号CN109582786B

    专利类型发明专利

  • 公开/公告日2020-11-24

    原文格式PDF

  • 申请/专利权人 中国科学院深圳先进技术研究院;

    申请/专利号CN201811287359.6

  • 发明设计人 曲强;杨敏;

    申请日2018-10-31

  • 分类号G06F16/35(20190101);G06F16/36(20190101);G06F40/289(20200101);

  • 代理机构44316 深圳市科进知识产权代理事务所(普通合伙);

  • 代理人曹卫良

  • 地址 518055 广东省深圳市南山区深圳大学城学苑大道1068号

  • 入库时间 2022-08-23 11:22:43

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号