首页> 中国专利> 一种基于BERT的海运邮件命名实体识别方法

一种基于BERT的海运邮件命名实体识别方法

摘要

本发明公开了一种基于BERT的海运邮件命名实体识别方法,其包括对海运邮件进行数据预处理,获得海运邮件数据集;统计高频词汇构建扩展词汇表;利用Word2Vec模型生成扩展词向量;利用BERT模型训练生成原生词向量;合并扩展词汇表和原生词汇表形成海运邮件词汇表,合并扩展词向量和原生词向量形成海运邮件词向量;利用BERT模型训练海运邮件词向量获得上下文信息即分布式特征;利用神经网络中的全连接层将分布式特征映射到样本标签空间和调用条件随机场标签序列。本发明利用BERT模型和注意力机制训练海运邮件词向量获得上下文信息,不需要频繁制定规则,使得在大量海运邮件中识别效果要更好。

著录项

  • 公开/公告号CN114372468A

    专利类型发明专利

  • 公开/公告日2022-04-19

    原文格式PDF

  • 申请/专利权人 大连海事大学;

    申请/专利号CN202210038063.0

  • 发明设计人 周新;刘彬;郭爱彬;

    申请日2022-01-13

  • 分类号G06F40/295;G06F40/289;G06F40/284;G06N3/04;G06N3/08;

  • 代理机构大连至诚专利代理事务所(特殊普通合伙);

  • 代理人张海燕;杜广虎

  • 地址 116000 辽宁省大连市甘井子区凌水街道凌海路1号

  • 入库时间 2023-06-19 15:00:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-19

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号