首页> 中国专利> 一种基于蒸馏BERT与改进Transformer相结合的蒙汉神经机器翻译方法

一种基于蒸馏BERT与改进Transformer相结合的蒙汉神经机器翻译方法

摘要

一种基于蒸馏BERT与改进Transformer相结合的蒙汉神经机器翻译方法,从基于语境化的词向量预训练模型中提取静态的词向量表征,并将其输入到改进Transformer机器翻译模型的所有层进行蒙汉机器翻译。本发明从基于语境化的词向量预训练模型BERT中提取静态嵌入以达到蒸馏BERT的目的,同时尝试将蒸馏BERT的输出表征作为改进Transformer机器翻译模型的词嵌入。该方法主要针对BERT预训练词向量模型难训练、训练时间开销过大,以及Transformer机器翻译模型超参数化、需预热等问题,试图将动静态嵌入相融合的预训练模型与改进的Transformer机器翻译模型结合在一起,以达到提高蒙汉机器翻译效率、提升蒙汉机器翻译质量的目的。

著录项

  • 公开/公告号CN112347796B

    专利类型发明专利

  • 公开/公告日2022-02-11

    原文格式PDF

  • 申请/专利权人 内蒙古工业大学;

    申请/专利号CN202011250555.3

  • 申请日2020-11-10

  • 分类号G06F40/58(20200101);G06F40/284(20200101);G06F40/205(20200101);G06F40/30(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构61215 西安智大知识产权代理事务所;

  • 代理人段俊涛

  • 地址 010080 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区

  • 入库时间 2022-08-23 13:05:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-11

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号