文摘
英文文摘
第1章 绪论
1.1 课题背景
1.1.1 企业信息检索简介
1.1.2 中文分词技术发展现状
1.2 课题的提出及意义
1.3 课题的研究内容
1.4 本文的组织结构
第2章 相关工作
2.1 中文分词关键技术
2.1.1 中文分词算法
2.1.2 分词词典机制
2.2 中文分词难点
2.2.1 通用词表和切分规范
2.2.2 切分歧义
2.2.3 未登录词识别
2.3 分词和企业信息检索的关系
2.3.1 分词对企业信息检索的影响
2.3.2 分词精度与检索性能的关系
2.4 本章小结
第3章 中文分词系统的设计
3.1 设计原则
3.2 系统框架
3.3 词典设计
3.3.1 词典结构
3.3.2 词典算法
3.3.3 词典存储
3.4 本章小结
第4章 中文分词系统的实现
4.1 词典管理
4.2 分词预处理
4.2.1 文档抽取
4.2.2 文本预切分
4.3 分词
4.4 歧义处理
4.4.1 歧义字段检测
4.4.2 交叉歧义消除
4.5 未登录词识别
4.5.1 分词碎片处理
4.5.2 未登录词识别
4.6 本章小结
第5章 测试与分析
5.1 系统功能测试
5.2 词典性能测试
5.2.1 评测指标
5.2.2 测试结果与分析
5.3 分词性能测试
5.3.1 评测指标
5.3.2 测试结果与分析
5.4 本章小结
第6章 总结与展望
参考文献
致谢