文摘
英文文摘
声明
第一章绪 论
1.1引言
1.2中文分词研究现状
1.3本文的主要研究内容
1.4本文组织结构
第二章中文分词概述
2.1分词系统的主要目标
2.2自动分词中存在的主要问题
2.2.1分词规范的难点
2.2.2歧义字段的切分
2.2.3未登录词辨识
2.3分词方法的基本策略
2.3.1基于词典的机器分词
2.3.2基于统计的分词方法
2.3.3基于规则的分词算法
2.3.4基于理解的分词方法
2.4现有几种中文分词系统
2.5汉语自动分词的评测指标
第三章歧义消解和未登录词识别方法
3.1歧义字段的分类
3.2基于规则的分词消歧
3.3基于统计方法的分词消歧
3.3.1基于词频的消歧方法
3.3.2基于互信息歧义切分方法
3.4中文姓名的识别
3.4.1中文姓名识别的难点
3.4.2中文姓名本身规律
3.4.3名字用字分类和特点
第四章基于互信息的中文姓名识别算法
4.1本文拟解决的问题
4.2姓名识别算法描述
4.2.1正向逆向最大匹配算法
4.2.2待分析字符串的预处理
4.2.3基于词典的分词算法的改进
4.2.4算法设计
第五章总结与展望
参考文献
致 谢
在学期间公开发表论文及著作情况