首页> 中国专利> 机器翻译中的模型训练方法、装置、电子设备及存储介质

机器翻译中的模型训练方法、装置、电子设备及存储介质

摘要

本申请公开了一种机器翻译中的模型训练方法、装置、电子设备及存储介质,涉及自然语言处理技术领域、以及深度学习技术领域。具体实现方案为:基于平行语料库,采用机器翻译模型和语义相似度模型,挖掘一组样本的相似目标语句,并创建第一训练样本集;采用第一训练样本集,训练机器翻译模型;基于平行语料库,采用机器翻译模型和语义相似度模型,挖掘一组样本中各样本的负样本,并创建第二训练样本集;采用第二样本训练集,训练语义相似度模型。本申请通过采用上述技术方能,将两个模型的联合训练,能够在训练语义相似度模型的同时,优化机器翻译模型,并反哺语义相似度模型,使得语义相似度模型的准确性进一步得到提高。

著录项

  • 公开/公告号CN111859997A

    专利类型发明专利

  • 公开/公告日2020-10-30

    原文格式PDF

  • 申请/专利权人 北京百度网讯科技有限公司;

    申请/专利号CN202010550591.5

  • 申请日2020-06-16

  • 分类号G06F40/58(20200101);G06K9/62(20060101);G06F40/30(20200101);G06N20/00(20190101);

  • 代理机构11412 北京鸿德海业知识产权代理事务所(普通合伙);

  • 代理人田宏宾

  • 地址 100085 北京市海淀区上地十街10号百度大厦2层

  • 入库时间 2023-06-19 08:44:14

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号