文摘
英文文摘
声明
第一章绪论
1.1研究背景和选题意义
1.2词性标注方法介绍
1.3词性标注研究历史和现状
1.3.1国外研究
1.3.2国内研究
1.4研究内容及研究方法
1.4.1研究内容
1.4.2研究方法
1.5论文的组织结构
第二章词性标注统计模型
2.1统计语言模型
2.2隐马尔可夫模型
2.2.1隐马尔可夫模型概述
2.2.2隐马尔可夫模型需要解决的问题
2.3模型参数的获取
2.4隐马尔可夫模型的参数平滑
2.4.1词性概率的平滑
2.4.2词汇概率的求解
2.5标准VITERBI算法
2.5.1 VITERBI算法的三重循环
2.5.2 VITERBI算法的基本过程
第三章词性标注系统的设计与实现
3.1词性标记集的选择
3.2训练语料库的选择
3.3系统的设计
3.3.1系统的开发环境
3.3.2系统的功能
3.3.3系统的整体框架
3.4蒙古文切分模块的实现
3.4.1句子的切分
3.4.2附加成分的切分
3.4.3阿拉伯数字的切分
3.5词性自动标注模块的实现
3.5.1打开训练语料库模块的实现
3.5.2获得模型参数模块的实现
3.5.3平滑参数模块的实现
3.5.4基于VITERBE算法进行词性标注模块的实现
3.5.5解决生词模块的实现
3.5.6输出标注结果模块的实现
第四章实验结果及分析
4.1切分之前的实验结果及结果分析
4.1.1实验结果
4.1.2实验结果分析
4.2切分之后的实验结果及结果分析
4.2.1实验结果
4.2.2实验结果分析
第五章结论与展望
5.1研究工作结论
5.2进一步工作展望
参考文献
附录 面向信息处理的蒙古语标记集
攻读硕士学位期间发表的学术论文
致谢