统计与规则相结合的维吾尔语人名识别方法

塔什甫拉提·尼扎木丁; 汪昆; 艾斯卡尔·艾木都拉; 帕力旦·吐尔逊

首页> 中文期刊>自动化学报 >统计与规则相结合的维吾尔语人名识别方法

统计与规则相结合的维吾尔语人名识别方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

命名实体识别(Named entity recognition,NER)是自然语言处理(Natural language processing,NLP)中重要的任务,其中人名实体是主要的识别对象之一.本文从维吾尔语黏着性特点出发,从词干、音节、字符串三个角度对维吾尔语单词进行拆分,获得更小的语言单元,并把切分的新单元作为特征加入到条件随机场(Conditional random field,CRF)中,明显缓解了数据稀疏的影响,取得了比以单词为基本单元的人名识别方法更好的性能.同时还从维吾尔语中汉族人名的特点出发,提出了基于规则的维吾尔语中汉族人名的识别方法,最终利用统计和规则相结合的方法进一步提高了识别的准确率.实验结果表明,该方法人名识别的准确率、召回率和F1值分别达到了87.47％、89.12％和88.29％.%Named entity recognition (NER) is an important subtask of natural language processing,where person name is one of the major objects.From agglutinative characteristics of the Uyghur language,we split a Uygur word into different level units such as syllable,suffix,stem,etc.,so as to significantly reduce the data sparse problem.Since the Han people name is the major remaining errors for the CRF (Conditional random field)-based approach,we also propose a rule-based post-processing approach for Han people name recognition in Uyghur language.Experimental results show that this cascade approach achieves satisfactory performance,and that the recognition accuracy,recall rate and F1 score are 87.47％、89.12 ％ and 88.29 ％,respectively.

著录项

来源
《自动化学报》|2017年第4期|653-664|共12页
作者
塔什甫拉提·尼扎木丁; 汪昆; 艾斯卡尔·艾木都拉; 帕力旦·吐尔逊;
展开▼
作者单位

新疆大学信息科学与工程学院乌鲁木齐830046;

中国科学院自动化研究所模式识别国家重点实验室北京100190;

新疆大学信息科学与工程学院乌鲁木齐830046;

新疆大学软件学院乌鲁木齐830046;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
维吾尔语; 人名识别; 条件随机场; 音节库;
入库时间 2023-07-25 14:33:20

相似文献

中文文献
外文文献
专利

1. CRF与规则相结合的藏文人名识别方法 [J] . 加羊吉 ,李亚超 ,于洪志 . 西北民族大学学报（自然科学版） . 2016,第003期
2. 统计与规则相结合的维吾尔语句子边界识别 [J] . 艾山·吾买尔 ,吐尔根·依步拉音 . 计算机工程与应用 . 2010,第014期
3. 统计与规则相结合的藏文人名自动识别研究 [J] . 窦嵘 ,加羊吉 ,黄伟 . 长春工程学院学报（自然科学版） . 2010,第002期
4. 一种规则与统计相结合的应用题句子语义角色识别方法 [J] . 吴林静 ,劳传媛 ,范桂林 . 计算机应用研究 . 2018,第008期
5. 统计和规则相结合的中文姓名识别方法研究 [J] . 刘竞 ,苏万力 . 福建电脑 . 2006,第007期
6. 基于规则与统计的维吾尔族人名识别研究 [C] . Sayida · Ablimiti ,赛依旦·阿不力米提 ,Turgun·Ibrayim . 第十一届全国计算语言学学术会议 . 2011
7. 基于统计和规则的中文人名识别研究与实现 [A] . 臧勇真 . 2013

统计与规则相结合的维吾尔语人名识别方法

摘要

著录项

相似文献

相关主题

期刊订阅