文摘
英文文摘
声明
第一章绪论
1.1研究背景与意义
1.1.1研究背景
1.1.2研究意义
1.2国内外研究现状
1.2.1汉语自动分词研究现状
1.2.2汉语自动分词的难点
1.3本文研究的目的和内容
1.3.1本文的研究目的
1.3.2本文的研究内容
第二章汉语自动分词
2.1汉语自动分词基本算法
2.1.1基于字符串匹配的分词方法
2.1.2基于理解的分词方法
2.1.3基于统计的分词方法
2.2语言模型
2.2.1隐马尔科夫模型(HMM)
2.2.2 N最短路径模型
2.3汉语自动分词的难点
2.3.1歧义切分字段
2.3.2未登录词识别
第三章歧义字段
3.1歧义字段概述
3.2歧义字段产生的根源
3.2.1中文的书写格式
3.2.2分词词典的构建不完善
3.2.3地名的存在增加了歧义字段
3.2.4新词汇的出现产生的歧义现象
3.3 POI中的歧义字段
3.4识别歧义字段的方法
3.4.1识别交集型歧义字段的方法
3.4.2识别组合型歧义字段的方法
第四章词典的设计
4.1分词词典的建立
4.2词典的内容
4.3词典的常用组织结构
第五章系统的设计与实现
5.1系统的设计思路
5.2系统的主要模块和流程
5.2.1系统流程图
5.2.2系统的主要模块和功能
5.3系统的实现
5.3.1系统开发工具的选择
5.3.2全切分模块的实现
5.3.3歧义词处理模块的实现
5.3.4未登录词识别模块的实现
5.4程序应用举例
5.5程序测试结果
第六章结论与展望
6.1主要结论
6.2系统展望
参考文献
致谢
西南大学;