文摘
英文文摘
论文说明:插图索引、附表索引
湖南大学学位论文原创性声明及版权使用授权书
第1章绪论
1.1课题来源
1.2研究目的与意义
1.3研究内容
1.4本文主要工作
1.5本文组织结构
第2章相关研究综述
2.1自动分词
2.1.1基本概念
2.1.2分词算法研究现状
2.1.3歧义切分研究现状
2.1.4未登录词研究现状
2.1.5主要应用领域
2.2现有分词系统
2.3评价体系
2.3.1评价体系概述
2.3.2评价方法和数据集
2.3.3评价指标
2.4本章小结
第3章自动分词算法分析
3.1引言
3.2存在的问题
3.3自动分词算法研究
3.3.1分词方法分类
3.3.2词典机制研究
3.3.3 MM和MP分词算法描述
3.4本章小结
第4章基于二字词检测位图表的MM自动分词算法
4.1引言
4.2中文词汇的统计分析
4.3基于二字词检测位图表的词典机制
4.3.1词典的组织与索引
4.3.2 词典的数据结构
4.3.3词典中二字词的优化策略
4.3.4二字词检测位图表映射机制
4.4基于二字词检测位图表的MM自动分词算法
4.4.1 MM分词模型
4.4.2算法描述
4.4.3实验结果及分析
4.5交集型歧义的自动检测与切分
4.5.1基本定义
4.5.2歧义检测
4.5.3歧义切分
4.5.4实验结果及分析
4.6基于Web查询日志挖掘的未登录词识别算法
4.6.1基本定义
4.6.2相关工作
4.6.3算法描述
4.6.4实验结果及分析
4.7本章小结
第5章分词系统实现及评价
5.1设计原则
5.2系统框架
5.3系统实现及结果分析
5.3.1实验数据
5.3.2实验结果
5.3.3分词结果示例
5.4性能评价
5.5本章小结
结论
参考文献
致谢
附录A攻读硕士期间发表的论文
附录B攻读硕士期间参加的科研项目