首页> 中国专利> 预训练语言模型的训练方法、应用方法、装置及设备

预训练语言模型的训练方法、应用方法、装置及设备

摘要

本申请提出一种预训练语言模型的训练方法、应用方法、装置及设备,该方法包括:获取包括安全信息文本的训练样本集;在预设安全知识图谱中检索安全信息文本对应的安全扩展信息,将安全扩展信息添加到安全信息文本中;根据STIX情报库,通过预训练语言模型对安全信息文本进行词嵌入训练,词嵌入包括实体类别和关系类别的嵌入。本申请基于预设安全知识图谱扩充安全信息文本。在预训练语言模型的结构中增加类别嵌入层,通过类别嵌入层标记安全信息文本中的实体类别和关系类别,过滤掉与安全信息不相关的信息,提高模型准确率。在位置编码时为安全扩展信息与其对应的原始词设置相同的位置标记,使模型能更好地对真实安全事件进行语义建模。

著录项

  • 公开/公告号CN113158653A

    专利类型发明专利

  • 公开/公告日2021-07-23

    原文格式PDF

  • 申请/专利权人 北京智源人工智能研究院;

    申请/专利号CN202110450286.3

  • 发明设计人 康祎楠;董龙飞;

    申请日2021-04-25

  • 分类号G06F40/247(20200101);G06F40/289(20200101);G06F16/28(20190101);G06F16/36(20190101);

  • 代理机构11619 北京辰权知识产权代理有限公司;

  • 代理人尹倩倩

  • 地址 100083 北京市海淀区中关村东路1号院8号楼三层B201D-1

  • 入库时间 2023-06-19 11:57:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-26

    专利权的转移 IPC(主分类):G06F40/247 专利号:ZL2021104502863 登记生效日:20220413 变更事项:专利权人 变更前权利人:北京创新智源科技有限公司 变更后权利人:北京天际友盟信息技术有限公司 变更事项:地址 变更前权利人:100084 北京市海淀区中关村东路1号院8号楼三层B201C-1 变更后权利人:100085 北京市海淀区上地五街16号1幢2层266室

    专利申请权、专利权的转移

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号