首页> 中国专利> 一种面向警情文本的多特征融合命名实体识别方法

一种面向警情文本的多特征融合命名实体识别方法

摘要

本发明涉及自然语言处理的命名实体识别技术领域,具体为一种面向警情文本的多特征融合命名实体识别方法,首先,构建警情命名实体识别的数据集,定义待识别的实体类型,并划分为训练集、验证集和测试集;其次,使用预训练的字向量得到文本的字符特征,基于规则和字典进行文本匹配得到预识别的标签特征,将文本进行拼音转换得到拼音特征;最后,将上述三种特征融合,送入双向长短期记忆网络‑条件随机场模型中进行命名实体识别;本发明通过构建一种多特征融合的中文命名实体识别方法,通过融合文本字符特征、预识别的标签特征和拼音特征,有效地表征了字的多义性,提高了警情文本命名实体识别的精确率、召回率和综合评价指标F1值。

著录项

  • 公开/公告号CN115146644B

    专利类型发明专利

  • 公开/公告日2022.11.22

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN202211063791.3

  • 发明设计人 徐同阁;王昊旻;杨立群;刘连忠;

    申请日2022.09.01

  • 分类号G06F40/295(2020.01);G06N3/04(2006.01);G06F16/35(2019.01);G06F40/242(2020.01);G06F40/279(2020.01);

  • 代理机构北京天汇航智知识产权代理事务所(普通合伙) 11987;

  • 代理人陈陈数

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2022-12-29 02:01:09

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号