文摘
英文文摘
论文说明:图表目录
声明
第一章绪论
1.1汉语分词在中文信息处理中的意义
1.2汉语分词的现实性与可能性
1.3论文的主要研究内容
第二章相关技术研究
2.1汉语分词的标准与原则
2.2汉语分词的基本算法
2.2.1最长匹配法
2.2.2最少分词法
2.2.3基于统计语言模型的分词方法
2.2.4基于隐马尔科夫模型的分词方法
2.2.5汉语分词算法比较
2.3汉语分词系统介绍
2.4汉语分词的关键问题
2.4.1歧义切分问题
2.4.2未登录词识别问题
第三章汉语自适应分词算法研究
3.1信息检索用汉语分词的特点
3.2汉语自适应分词算法提出
3.2.1算法术语描述
3.2.2算法原理概述
3.2.3算法原理细则
3.2.4歧义识别辅助未登录词识别
3.3汉语自适应逆向最长分词算法描述及实现
3.4汉语自适应分词算法中的未登录词识别技术研究
3.4.1未登录词识别的数量词识别规则
3.4.2未登录词识别的边界单字规则
3.4.3未登录词识别的虚字辅助规则
3.4.4未登录词识别中的单字非成词概率规则
3.4.5未登录词识别的记忆识别规则
3.5汉语自适应分词算法
3.5.1汉语自适应分词算法描述
3.5.2汉语自适应分词算法流程图描述
3.5.3算法中的未登录词识别模块流程图描述
3.6汉语自适应分词算法中的词表查询算法研究
3.6.1词表查询算法简介
3.6.2对传统词表查询算法的改进
第四章汉语自适应分词系统
4.1汉语自适应分词系统的总体设计
4.2汉语自适应分词系统核心模块设计
4.2.1语句预处理模块
4.2.2未登录词识别模块
4.2.3歧义处理模块
4.2.4词表管理模块
4.3汉语自适应分词算法动态链接库的设计
4.4汉语自适应分词系统的词表建设
4.5汉语自适应分词系统的开发环境简介
4.6汉语自适应分词系统的实现
4.7汉语自适应分词系统的可扩展性与可移植性
4.7.1汉语自适应分词系统的可扩展性
4.7.2汉语自适应分词系统支持多种访问接口
4.7.3移植汉语自适应分词系统到Linux平台下
第五章汉语自适应分词系统测评
5.1分词系统测评概述
5.2系统的效能测评
5.2.1系统的处理性能测评
5.2.2系统的CPU与RAM负荷测评
5.2.3系统的稳定性测评
5.3系统的分词准确率测评
5.4系统识别未登录词的性能测评
第六章总结与展望
6.1所做的主要工作
6.2本文的创新之处
6.3存在的问题
6.4进一步的工作
参考文献
致谢
南京农业大学;