首页> 中国专利> 一种适用于多语言多领域的命名实体识别方法

一种适用于多语言多领域的命名实体识别方法

摘要

本发明公开了一种适用于多语言多领域的命名实体识别方法,包括以下步骤:构建初始化语料库,使用word2vec训练字嵌入矩阵;设定阈值n;对句子进行顺序遗忘编码;使用前向及后向并行LSTM分别计算长度为1,2…,n的单词记忆单元状态;融合前向及后向并行LSTM记忆单元状态;计算前向及后向LSTM的隐藏单元状态,级联前向LSTM和后向LSTM隐藏单元状态;输入单向LSTM进行实体标签预测;使用L2正则的句子级对数似然损失来训练模型,以平衡模型复杂度和准确度。本发明通过FOFE编码,充分利用了句子中字序列信息,省去了外部知识库,没有领域依赖,只需要大量的训练语料库,均能取得较好的NER结果。

著录项

  • 公开/公告号CN109871541A

    专利类型发明专利

  • 公开/公告日2019-06-11

    原文格式PDF

  • 申请/专利权人 电子科技大学;

    申请/专利号CN201910169547.7

  • 申请日2019-03-06

  • 分类号

  • 代理机构北京众合诚成知识产权代理有限公司;

  • 代理人苗艳荣

  • 地址 610054 四川省成都市建设北路二段4号

  • 入库时间 2024-02-19 10:15:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-05

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20190306

    实质审查的生效

  • 2019-06-11

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号