文摘
英文文摘
声明
第一章绪论
1.1引言
1.2课题的研究背景
1.2.1中文分词技术的应用领域
1.2.2中文分词技术的发展现状
1.2.3中文分词技术的关键问题
1.2.4中文分词技术的未来发展趋势
1.3课题的研究目的和研究内容
1.3.1研究目的
1.3.2研究内容
1.4本章小结
第二章相关技术介绍
2.1中文分词的基本方法
2.1.1基于字符串匹配的分词方法
2.1.2基于理解的分词方法
2.1.3基于统计的分词方法
2.2开发语言和工具
2.2.1 Java语言简介
2.2.2 Apache Lucene简介
2.2.3 Eclipse 3.2简介
2.3其他相关技术
2.3.1 OOA,OOD和OOP
2.3.2设计模式
2.3.3 Unicode字符编码
第三章中文分词系统的设计
3.1分词系统的功能及要求
3.2分词系统框架
3.3分词系统设计原则
3.3.1外部接口设计
3.3.2系统界面设计
3.3.3词典机制设计
3.3.4分词机制设计
第四章中文分词系统的实现
4.1词典机制
4.1.1词典的物理结构
4.1.2词典的逻辑结构
4.2分词机制
4.2.1预处理模块
4.2.2源语句初分
4.2.3初分后语言信息处理
4.3外部接口
4.4系统界面
4.5本章小结
第五章实验结果与分析
5.1分词速度测试
5.2分词精度测试
5.3实验结果分析
第六章结论与展望
6.1本文结论
6.2后续工作展望
参考文献
致谢
研究成果以及发表学术论文
作者和导师简介