首页> 中国专利> 一种基于预训练模型BERT的网络空间安全领域命名实体识别方法和装置

一种基于预训练模型BERT的网络空间安全领域命名实体识别方法和装置

摘要

本发明涉及一种基于预训练模型BERT的网络空间安全领域命名实体识别方法和装置。该方法对输入的网络空间安全领域的句子文本使用BERT模型的分词器WordPiece进行分词预处理;将分词预处理得到的所有token加载至BERT模型中进行训练,获得输出的向量表示,并将其送至Highway网络和分类器,将token的向量表示的维度映射至与标签数量一致的维度,得到token的最终向量表示;然后只使用每一个单词的第一个token来使用交叉熵损失函数计算损失,将其反向传播以更新模型参数,得到训练完成的安全领域命名实体识别模型,用于安全领域命名实体识别。本发明能够有效地解决安全文本做命名实体识别任务。

著录项

  • 公开/公告号CN111460820B

    专利类型发明专利

  • 公开/公告日2022-06-17

    原文格式PDF

  • 申请/专利权人 中国科学院信息工程研究所;

    申请/专利号CN202010151014.9

  • 申请日2020-03-06

  • 分类号G06F40/295;G06F40/30;G06N3/04;

  • 代理机构北京君尚知识产权代理有限公司;

  • 代理人邱晓锋

  • 地址 100093 北京市海淀区闵庄路甲89号

  • 入库时间 2022-08-23 13:52:09

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号