基于隐马尔科夫模型的中文命名实体识别研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息时代的到来和Internet的发展，用自然语言作为人机交互已是必然趋势，这对自然语言处理的深度和广度提出了越来越高的要求。自命名实体识别技术在1995年的MUC-6(Message Understanding Conference)会议上提出以来，越来越受到自然语言处理研究者的关注，并成为很多应用中的关键技术。本文对命名实体识别的方法进行了研究，分析了基于规则的方法和基于统计的方法的优缺点。由于获取上下文信息的多少和数据平滑的程度是评价识别性能的两个重要参数，而以前的统计模型获取上下文信息有限，本文提出了一种基于三阶隐马尔科夫模型的命名实体识别方法，该方法使用语言知识进行约束，兼顾了准确率和召回率，取得了较好的识别效果。自动分词和词性标注直接影响命名实体的识别，本文采用了海量智能分词系统对文本进行分词和标注。在统计词频方面，本文使用了改进的K均值方法对参数进行估计，并采用线性差值法对参数结果进行平滑处理。在命名实体识别方面，本文采用改进的Viterbi算法对初始观察序列重新标注，并求出最佳的状态序列。本文识别的主要内容为实体词，即人名、地名和机构名。目前，中文命名实体识别实验仍处于初期阶段，还有不少工作有待进一步完善。今后的工作将进一步研究规则的制定和数据平滑技术，以期进一步提高命名实体的识别率。

著录项

作者
赵琳瑛;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科情报学
授予学位硕士
导师姓名赵捧未;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;图书馆管理集成系统;
关键词
自然语言处理; 中文命名实体识别; 隐马尔科夫模型; 自动分词;

相似文献

中文文献
外文文献
专利

1. 基于改进的隐马尔科夫模型的中文命名实体识别算法 [J] . 刘杰 . 太原师范学院学报（自然科学版） . 2009,第001期
2. 基于隐马尔科夫模型的中文术语识别研究 [J] . 岑咏华 ,韩哲 ,季培培 . 现代图书情报技术 . 2008,第012期
3. 基于隐马尔科夫模型的中文分词研究 [J] . 魏晓宁 . 电脑知识与技术 . 2007,第021期
4. 基于隐马尔科夫模型的中文分词研究 [J] . 魏晓宁 . 电脑知识与技术 . 2007,第021期
5. 基于隐马尔科夫模型的中文分词研究 [J] . 魏晓宁 . 电脑知识与技术：学术交流 . 2007,第011期
6. 基于分层隐马尔科夫模型的连续手势识别研究 [C] . Tao Chongben ,陶重犇 ,Li Chunguang . 2017年全国高性能计算学术年会 . 2017
7. 基于N最短路径和隐马尔科夫模型的中文POI分词系统的研究 [A] . 唐霄 . 2008

基于隐马尔科夫模型的中文命名实体识别研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅