封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1研究意义
1.2信息检索简介
1.3中文搜索引擎
1.4论文的组织结构
第二章 中文自动分词技术及其发展情况
2.1中文自动分词简介
2.2中文自动分词的现状
2.3目前常用的分词算法及比较
2.4中分分词中存在的主要问题
2.5分词对中文信息检索的影响
第三章 基于词典匹配和统计方法相结合的中文分词算法的实现
3.1统计的分词方法
3.2常用词典存储结构介绍
3.3双数组Trie树(Double-Array Trie)优化算法
第四章 算法对歧义切分和未登录词识别的处理
4.1歧义切分问题
4.2未登录词识别
4.3本章总结及相应实验结果
第五章 实验结果分析及结论
5.1分词性能测试
第六章全文工作总结及展望
6.1本文的主要工作
6.2未来工作展望
参考文献
致谢
攻读学位期间发表的学术论文