首页> 中国专利> 一种预训练语言模型的训练方法、存储介质及服务器

一种预训练语言模型的训练方法、存储介质及服务器

摘要

本发明提供了一种预训练语言模型的训练方法、存储介质及服务器,该训练方法通过利用特定场景的文本语料对通用领域的语言模型进行预训练,所得到的专业领域的预训练语言模型可以更好地捕捉到特定场景下文本语料中的独有信息。通过分词工具分词,使得整体的词语作为是否被遮蔽的目标,能够加大语言模型的训练难度,提升语言模型的语义理解能力,进而提升经过训练所获得的预训练语言模型的准确性。增加的每条文本的类别标签信息也富有丰富的语义信息,通过加入类别标签信息,能够更好的让预训练语言模型理解整体的语言效果。改善采用预训练语言模型处理下游的自然语言处理任务过程中的准确性及效率。

著录项

  • 公开/公告号CN113961669A

    专利类型发明专利

  • 公开/公告日2022-01-21

    原文格式PDF

  • 申请/专利号CN202111251502.8

  • 申请日2021-10-26

  • 分类号G06F16/33(20190101);G06F16/35(20190101);G06F40/289(20200101);G06F40/30(20200101);

  • 代理机构11667 北京兰亭信通知识产权代理有限公司;

  • 代理人赵永刚

  • 地址 310012 浙江省杭州市西湖区华星路99号东软创业大厦3楼A座

  • 入库时间 2023-06-19 13:58:51

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号