首页> 中国专利> 语言模型的训练方法、文本匹配方法及相关装置

语言模型的训练方法、文本匹配方法及相关装置

摘要

本申请公开了一种语言模型的训练方法、文本匹配方法及相关装置,本申请提供的方案能够通过粒度划分,将目标领域的高频词语融入第一训练文本,并以SOP任务和MSP任务为第一阶段的训练任务,采用该第一训练文本预训练语言模型。由此,在预训练阶段,该方法不仅能够让语言模型学习到通用领域的知识,还能够学习到目标领域的知识。并且,该方法还能够以文本匹配任务为第二阶段的训练任务,采用从目标领域获取到的第二训练文本训练语言模型,从而使语言模型能够更广泛地学习到该目标领域的基础知识。由此,可以增加该语言模型的泛化能力,从而确保模型的训练效果。

著录项

  • 公开/公告号CN114626463A

    专利类型发明专利

  • 公开/公告日2022-06-14

    原文格式PDF

  • 申请/专利权人 腾讯科技(深圳)有限公司;

    申请/专利号CN202210261106.1

  • 发明设计人 余剑扬;陈楚杰;谢润泉;邵纪春;

    申请日2022-03-16

  • 分类号G06K9/62;G06F40/205;G06F40/211;G06F40/216;G06F40/30;G06N3/04;G06N3/08;

  • 代理机构北京三高永信知识产权代理有限责任公司;

  • 代理人李文静

  • 地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层

  • 入库时间 2023-06-19 15:39:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-14

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号