文摘
英文文摘
论文说明:图表目录
声明
第一章绪论
第一节论文背景的介绍与问题提出
1.1.1 自然语言处理
1.1.2 中文分词的提出
第二节中文分词的意义与应用
第三节论文的主要内容
第二章中文分词研究基础理论
第一节中文分词算法的发展
2.1.1 基于词典的机械分词
2.1.2 基于信息论和概率论的统计分词
第二节国内外分词研究成果
2.2.1 国内研究成果
2.2.2 国外研究成果
第三节分词的难点
第三章基于后缀数组SALM模型的混合分词
第一节词典模块
3.1.1 Berkeley DB
3.1.2 SALM模型生成粗词典
3.1.3 生语料库预处理
3.1.4 词典的减枝
第二节分词模块
3.2.1句子字词表
3.2.2分词和歧义判断
3.2.3歧义的解决
第三节分词系统框架
第四章系统实验结果和分析
第一节词典模块的实验
4.1.1词典的查找效率
4.1.2词典的完备性
第二节分词模块的实验
第五章总结与展望
附录
参考文献
致谢
个人简历