文摘
英文文摘
论文说明:图表目录
声明
致谢
第一章绪论
1.1课题来源
1.2课题研究背景和意义
1.3中文信息处理
1.4本文的主要研究内容及组织结构
第二章中文自动分词
2.1中文自动分词研究的意义
2.2中文自动分词的研究方法
2.2.1基于字符串匹配的分词方法
2.2.2基于理解的分词方法
2.2.3基于统计的分词方法
2.3中文自动分词面临的问题
2.3.1汉语词的概念尚待解决
2.3.2中文分词的规范问题
2.3.3歧义消解
2.3.4未登陆词识别
2.4已实现的中文自动分词系统
2.4.1几个国内大学研究的分词系统
2.4.2微软研究院汉语句法分析器中的自动分词
2.5本章小结
第三章基于语境信息的分词模型
3.1语境信息
3.2局部概率偏见问题
3.3粗切分模型
3.4基于语料信息和语境信息的分词模型
3.5实验分析
3.6本章小结
第四章基于语境和停用词驱动的未登录词识别
4.1停用词
4.2停用词驱动的未登录词识别模型
4.3算法描述
4.4实验设计
4.4.1实验语料
4.4.2实验评价标准
4.5实验结果及分析
4.6本章小结
第五章 语境信息和停用词驱动的分词系统
5.1系统介绍
5.1.1系统框架
5.1.2系统界面
5.1.3用户使用说明
5.2系统实验示例
5.3本章小结
第六章 结束语
6.1总结
6.2展望
参考文献
攻读硕士学位期间参加研究的课题和发表的论文