融合全局词语边界特征的中文命名实体识别方法

刘冰洋; 伍大勇; 刘欣然; 程学旗

首页> 中文期刊>中文信息学报 >融合全局词语边界特征的中文命名实体识别方法

融合全局词语边界特征的中文命名实体识别方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Supervised character sequence labeling model is a popular method in Chinese named entity recognition(NER) task.It is found in practice suffering from word boundary error,covering roughly 47.5 ％ of all errors.This paper incorporates global words boundary features in averaged perceptron model.Experiments indicate that the F value of recognizing people name,location names and organization names is improved by 0.04,reducing the proportion of boundary errors in overall errors.%目前在中文命名实体识别的任务中经常采用有监督的字序列标注模型.我们在实际应用中发现,基于字序列标注模型的中文命名实体识别模型对于词语边界的识别错误是影响识别效果的主要因素之一,边界错误平均占错误结果中的47.5％.该文通过在平均感知机模型中引入全局的词语边界特征,使得人名、地名、机构名识别的F值平均提升了0.04并降低了边界错误占错误结果的比例.

著录项

来源
《中文信息学报》|2017年第2期|86-91|共6页
作者
刘冰洋; 伍大勇; 刘欣然; 程学旗;
展开▼
作者单位

中国科学院计算技术研究所网络数据科学与工程研究中心,北京100190;

中国科学院大学,北京100190;

中国科学院计算技术研究所网络数据科学与工程研究中心,北京100190;

国家计算机网络应急技术处理协调中心,北京100029;

中国科学院计算技术研究所网络数据科学与工程研究中心,北京100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
命名实体识别; 字序列标注; 全局特征; 词语边界特征;

相似文献

中文文献
外文文献
专利

1. 基于BERT与融合字词特征的中文命名实体识别方法 [J] . 朱亚明 ,易黎 . 电子设计工程 . 2021,第019期
2. 全局和局部特征提取相融合的中文文本特征提取方法研究 [J] . 王荣荣 . 河北北方学院学报（自然科学版） . 2013,第003期
3. 基于含边界词性特征的中文命名实体识别 [J] . 邱莎 ,王付艳 ,申浩如 . 计算机工程 . 2012,第013期
4. 融合多特征嵌入与注意力机制的中文电子病历命名实体识别 [J] . 巩敦卫 ,张永凯 ,郭一楠 . 北京科技大学学报 . 2021,第009期
5. 融合字词特征的中文嵌套命名实体识别 [J] . 黄铭 ,刘捷 ,戴齐 . 现代计算机 . 2021,第34期
6. 基于全局-边界融合网络的高分辨率遥感影像语义分割方法 [C] . 韩吉南 ,窦鑫 ,陈力 . 第七届高分辨率对地观测学术年会 . 2020
7. 基于字词读音融合特征模型的中文医疗文本命名实体识别方法研究 [A] . 赵鑫 . 2021

融合全局词语边界特征的中文命名实体识别方法

摘要

著录项

相似文献

相关主题

期刊订阅