首页> 中国专利> 基于预训练双语词向量的神经机器翻译方法

基于预训练双语词向量的神经机器翻译方法

摘要

本发明公开了一种基于预训练双语词向量的神经机器翻译方法,将标注对齐的平行语料进行“源语言‑目标语言”拼接作为XLM模型的输入进行预训练;训练:取预训练得到的双语词向量矩阵初始化翻译模型;将源语言输入编码器,将源语言编码的向量表示及对应目标语言输入解码器输出预测序列,将其与相应的目标序列进行对比并计算损失值,输入优化器对翻译模型参数进行优化;预测:在某个时间步里,将源语言输入优化的编码器,编码器输出相应向量表示,将该向量表示以及上一时间步翻译的目标语言词输入解码器,解码器输出该时间步的目标词,将不同时间步翻译的目标词按时间顺序进行拼接,得到源语言翻译的结果。该方法提高了低资源语种的机器翻译效果。

著录项

  • 公开/公告号CN113297841A

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN202110566113.8

  • 申请日2021-05-24

  • 分类号G06F40/216(20200101);G06F40/284(20200101);G06F40/58(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构23211 哈尔滨市阳光惠远知识产权代理有限公司;

  • 代理人刘景祥

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2023-06-19 12:19:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-10-27

    发明专利申请公布后的驳回 IPC(主分类):G06F40/216 专利申请号:2021105661138 申请公布日:20210824

    发明专利申请公布后的驳回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号