首页> 中国专利> 语言模型的微调方法、装置、计算设备和存储介质

语言模型的微调方法、装置、计算设备和存储介质

摘要

本发明公开了一种语言模型的微调方法、装置、计算设备和存储介质,包括:获取预训练好的语言模型、词组,所述词组包括离散的模板提示词和离散的标签词;设计微调语言模型的输入数据,所述微调输入数据包括文本语句、模板提示词以及遮蔽令牌;根据输入数据和标签词对语言模型进行遮蔽令牌预测任务的有监督学习,以优化语言模型的模型参数。通过弥合预训练的语言模型和微调的语言模型之间的差距,从而使微调的语言模型在下游的遮蔽令牌预测任务上表现更好;全量样本情况下,本方法相对传统微调方法效果较好,在少样本情况下,本方法效果提升更加显著,能够减少大量参数的计算成本,降低计算设备的计算开销。

著录项

  • 公开/公告号CN113468877A

    专利类型发明专利

  • 公开/公告日2021-10-01

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN202110777350.9

  • 申请日2021-07-09

  • 分类号G06F40/284(20200101);G06N20/00(20190101);G06F16/35(20190101);

  • 代理机构33224 杭州天勤知识产权代理有限公司;

  • 代理人曹兆霞

  • 地址 310013 浙江省杭州市西湖区余杭塘路866号

  • 入库时间 2023-06-19 12:46:51

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号