文摘
英文文摘
0前言
0.1自然语言理解概述
0.2机器翻译及其处理过程
0.3词性标注的意义
0.4标注词性的可能性和困难性
0.5词性标注应注意的问题
0.6兼类词及其特点
0.7词性标注的研究现状
0.8本文问题的提出及所做的工作
1词性标注统计模型
1.1 N-元标准统计模型
1.2基于统计的标注方法的基本问题
1.3参数获取方法
2完全二隐马尔可夫阶统计模型
2.1隐马尔可夫模型
2.1.1隐马尔可夫模型的形式描述
2.1.2 HMM的三个基本问题
2.2完全二阶模型参数
2.3.1词性概率的平滑
2.3.2词汇概率的平滑
2.4未登录词的词性标注
2.5改进的VITERBI算法
2.5.1改进的VITERBI算法变量
2.5.2完全二阶HMM模型VITERBI算法描述
2.5.3改进的VITERBI算法的复杂度
3词性标准系统的实现
3.1试验数据准备
3.1.1词性标注集
3.1.2训练语料准备
3.2系统的设计
3.2.1系统的开发环境
3.2.2系统功能要求
3.2.3系统接口定义及其数据结构
3.3系统实现描述
4测试结果及分析
4.1测试结果
4.2错误分析
5结论与展望
5.1结论
5.2展望
致谢
参考文献
附录
附录一:汉语基本词类标记集
附录二:定义
附录三:系统所用到的词典
大连理工大学学位论文版权使用授权书
大连理工大学;