首页> 中国专利> 语言模型训练方法、文案生成方法以及相关设备

语言模型训练方法、文案生成方法以及相关设备

摘要

本公开的实施方式涉及文本处理技术领域,更具体地,本公开的实施方式涉及语言模型训练方法、文案生成方法以及相关设备。语言模型训练方法包括:获取构成训练文本的文本元素序列,文本元素序列分为拼接在一起的源段序列和目标段序列,文本元素序列以序列开始标记开头,源段序列和目标段序列均以序列结束标记结尾;对文本元素序列添加掩码;将带有掩码的文本元素序列输入语言模型的变换器网络,通过变换器网络对文本元素序列中的每个文本元素编码成带有上下文信息的向量;利用表征向量得到掩码的预测值,并根据预测值和真实值之间的交叉损失函数对变换器网络进行训练,使其收敛,得到语言模型。本公开的技术方案能够增强语言模型的可扩展性。

著录项

  • 公开/公告号CN114048289A

    专利类型发明专利

  • 公开/公告日2022-02-15

    原文格式PDF

  • 申请/专利权人 杭州网易云音乐科技有限公司;

    申请/专利号CN202111340858.9

  • 发明设计人 费婷婷;王嘉璐;陈鸿翔;罗川江;

    申请日2021-11-12

  • 分类号G06F16/33(20190101);G06F40/211(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11438 北京律智知识产权代理有限公司;

  • 代理人李建忠;阚梓瑄

  • 地址 310052 浙江省杭州市萧山区钱江世纪城奔竞大道353号杭州国际博览中心A座1201室

  • 入库时间 2023-06-19 14:12:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号