首页> 中国专利> 一种结合Meta-KD框架和细粒度压缩的蒙汉机器翻译方法

一种结合Meta-KD框架和细粒度压缩的蒙汉机器翻译方法

摘要

一种结合Meta‑KD框架和细粒度压缩的蒙汉机器翻译方法,对中文语料、英文语料、蒙古文语料进行数据预处理以及数据集划分,利用Meta‑KD框架进行汉英翻译的学习,对BERT语言模型进行训练,然后根据元蒸馏算法使学生模型在元教师的指导下学习,得到用于蒙汉翻译的可迁移知识,结合细粒度压缩方法,在学生模型上进行蒙汉翻译的训练验证。本发明通过Meta‑KD的框架进行数据集的训练,更适合进行小语种的翻译,得到更准确翻译结果;而细粒度的压缩使得训练好的模型具有更快的训练速度。然后,本发明结合细粒度压缩的方法,通过信息熵对信息表示进行细粒度压缩,从而达到模型加速推断的目的。

著录项

  • 公开/公告号CN113887251A

    专利类型发明专利

  • 公开/公告日2022-01-04

    原文格式PDF

  • 申请/专利权人 内蒙古工业大学;

    申请/专利号CN202111151158.5

  • 申请日2021-09-29

  • 分类号G06F40/58(20200101);G06F40/30(20200101);G06F16/35(20190101);G06N3/08(20060101);

  • 代理机构61215 西安智大知识产权代理事务所;

  • 代理人段俊涛

  • 地址 010080 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区

  • 入库时间 2023-06-19 13:32:21

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号