基于N最短路径和隐马尔科夫模型的中文POI分词系统的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

汉语自动分词是中文自然语言处理的一项基础性工作，也是中文信息处理领域的一项基础性课题。本文从理论上分析和比较了目前各种汉语自动分词方法，对各种分词方法的技术特点进行了阐述。本文主要目标是设计并实现一个中文POI自动分词系统，在分析了自动分词面临的主要困难的基础上，设计并实现了一个基于多步处理策略的中文POI自动分词系统。论文首先介绍了汉语自动分词系统通常采用的分词算法和自动分词面临的难点，分析了歧义字段产生的根源以及歧义字段的识别方法。其次搜集、整理和建立了研究所用的自然语言资源。主要包括语料库的搜集，分词词典的建立。论文设计并实现了一个基于多步处理策略的中文POI分词系统。系统包括初切分、歧义字段处理、未登录词识别等功能模块。初切分是找出待切分语句各种可能路径，利用N最短路径的方法；歧义字段处理根据POI自身的特点，利用自定义方法和隐马尔科夫模型相结合的方式处理交集型歧义；未登录词识别的功能是利用规则的方法，对未登录词中的地名等进行分析和处理。最后通过实验验证了系统的性能。同时对全文的工作进行了总结，提出进一步的研究工作。

著录项

作者
唐霄;
展开▼
作者单位

西南大学;

展开▼
授予单位西南大学;
学科地图学与地理信息系统
授予学位硕士
导师姓名周廷刚,张雪虎;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类测绘数据库与信息系统;
关键词
汉语自动分词; 自然语言处理; POI分词系统; 分词算法;

相似文献

中文文献
外文文献
专利

1. 基于隐马尔科夫模型的中文分词研究 [J] . 魏晓宁 . 电脑知识与技术 . 2007,第021期
2. 基于隐马尔科夫模型的中文分词研究 [J] . 魏晓宁 . 电脑知识与技术 . 2007,第021期
3. 基于隐马尔科夫模型的中文分词研究 [J] . 魏晓宁 . 电脑知识与技术：学术交流 . 2007,第011期
4. 基于隐马尔科夫模型的彝文分词系统设计与开发 [J] . 陈顺强 ,马嘿玛伙 . 西南民族大学学报（自然科学版） . 2012,第001期
5. 基于隐马尔科夫模型的中文术语识别研究 [J] . 岑咏华 ,韩哲 ,季培培 . 现代图书情报技术 . 2008,第012期
6. 基于逆向最短路径和统计模型的中文词语粗分方法 [C] . 闫新庆 ,王巍 ,李文锋 . 第十一届中国人工智能学术年会 . 2005
7. 基于隐马尔科夫模型的中文命名实体识别研究 [A] . 赵琳瑛 . 2008

基于N最短路径和隐马尔科夫模型的中文POI分词系统的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅