文摘
英文文摘
论文说明:图表目录
声明
第一章 绪论
第一节 论文背景的介绍与问题提出
1.1.1 搜索引擎
1.1.2 自然语言处理
1.1.3 中文分词
1.1.4 中文分词的意义
第二节 中文分词处理的要求
第三节 论文的主要内容
第二章 中文分词算法的发展与现状
第一节 中文分词算法的发展
2.1.1 基于词典的机械分词
2.1.2 基于统计的分词方法
2.1.3 基于理解的分词方法
2.1.4 关于几种分词算法的比较
第二节 国内外中文分词的研究成果
2.2.1 中科院计算所ICTLAS
2.2.2 海量智能分词CSW
2.2.3 国内外其他的分词研究成果
第三章 基于信赖度与潜力模型的混合分词算法
第一节 词典模块
3.1.1 词典文件的生成以及词条抽取过程
3.1.2 嵌入式数据库
3.1.3 Berkeley DB
3.1.4 关于本系统对于词典数据结构的要求
第二节 分词算法模块
3.2.1 分词预处理模块
3.2.2 分词模块
第四章 系统实验结果和分析
第一节 词典模块查找效率的实验
4.1.1 实验方法
4.1.2 实验环境
4.1.3 实验结果
第二节 分词模块的实验
4.2.1 测试工具Edit Distance of the Word Separator(EDWS)
4.2.2 分词评测结果及对比以及其他
4.2.3 系统的改进
4.2.4 拆分举例
第五章 总结与展望
参考文献
致 谢
个人简历