首页> 中国专利> 一种模型训练方法、文本生成方法、装置、介质及设备

一种模型训练方法、文本生成方法、装置、介质及设备

摘要

本发明公开了一种模型训练方法、文本生成方法、装置、介质及设备。其中,模型训练方法包括:获取样本文本,将所述样本文本输入至待训练的文本生成模型,获取所述编码器输出的所述样本文本中各词之间的相关性系数,以及所述解码器输出的自注意力参数和预测结果;基于所述样本文本中各词之间的相关性系数确定各词的重要性指数;基于所述各词的重要性指数、自注意力参数、所述预测结果和所述样本文本对应的标准文本生成损失函数;基于所述损失函数对所述待训练的文本生成模型进行模型参数调节,直到训练过程满足训练停止条件,得到目标文本生成模型。提高文本生成模型从输入文本中提取重要词的能力,进一步提高输出文本的质量。

著录项

  • 公开/公告号CN113762459A

    专利类型发明专利

  • 公开/公告日2021-12-07

    原文格式PDF

  • 申请/专利号CN202110105936.0

  • 发明设计人 李浩然;徐松;

    申请日2021-01-26

  • 分类号G06N3/04(20060101);G06N3/08(20060101);G06F40/284(20200101);G06F40/44(20200101);

  • 代理机构11332 北京品源专利代理有限公司;

  • 代理人孟金喆

  • 地址 100176 北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室

  • 入库时间 2023-06-19 13:37:05

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号