首页> 中文学位 >基于最小音素错误(MPE)训练算法的语音识别技术的研究
【6h】

基于最小音素错误(MPE)训练算法的语音识别技术的研究

代理获取

目录

文摘

英文文摘

声明

第一章引言

第一节研究背景

第二节研究内容及意义

第三节相关研究

第四节论文章节概要

第二章语音识别的基本理论

第一节语音识别概述

2.1.1语音识别技术的发展状况

2.1.2语音识别系统的整体结构

2.1.3语音识别系统的分类

2.1.4语音识别的主要方法

第二节HMM的基本理论

2.2.1 HMM的定义

2.2.2 HMM的基本算法

第三节基于HMM的统计语音识别

2.3.1语音信号处理与特征提取

2.3.2声学模型与模式匹配

2.3.3语言模型与语言处理

第三章HMM的基本训练方法

第一节最大相似度法则

3.1.1 Baum-Wlelch算法

第二节区分性训练法则

3.2.1贝叶斯风险(Bayes Risks)

3.2.2最大互信息训练法则(MaXimum Mutual Information)

3.2.3最小分类错误(Minimum Classification Error)

第三节本章小节

第四章最小音素错误用于HMM的训练

第一节目标函数的定义

第二节音素正确率的估算

第三节最大化目标函数

第四节模型参数的更新

第五节实现流程

第五章实验架构及结果

第一节实验组成

5.1.1HTK Toolkit

5.1.2语音库

5.1.3发音词典

5.1.4语言模型

5.1.5识别网络的建立

5.1.6解码算法的实现

第二节连续语音音素辨识系统性能评价指标

第三节实验结果及分析

5.3.1实验一:建模单元的选取

5.3.2实验二:状态中的高斯混合数

5.3.3实验三:惩罚因子

5.3.4实验四:活动Token数

5.3.5实验五:Phone Lattice的大小

5.3.6实验六:平滑系数D

5.3.7实验七:是否加入Ⅰ—平滑函数

第六章总结与展望

附录

参考文献

致谢

个人简历

展开▼

摘要

随着计算机技术的飞速发展,语音识别技术得到很大的进步。语音识别系统中最重要的部分就是声学模型的建立和训练,隐马尔可夫模型作为语音信号的一种统计模型,由于它能够很好地描述语音信号的非平稳性和时变性,因此在语音识别领域有着广泛的应用。 由于传统的声学模型训练方法采用最大化相似度训练法则(MaximumLikelihood Estimation, MLE),在训练时没有考虑模型与模型之间的联系,为了提升模型之间的相互区分度,区分性训练法则因而被提出。近年来有人提出将最小化音素错误训练法则(Minimum Phone Error, MPE)应用于大词汇量连续语音识别,并取得显著效果。于是本文将之应用于以连续数字串为语料的连续音素辨识系统。最小化音素错误采用词图(Phone Lattice)来代表所有可能句子的集合,本论文主要采用N-最佳路径(N-Best List)的方法来建构Phone Lattice(N-Best Synthesized Lattice),针对Phone Lattice中最混淆的部份做最有效率的训练。 在本文中,先以最大化相似度训练法则做声学模型的训练,接着采用最小化音素错误训练法则对声学模型进行再训练。实验结果显示相比于最大化相似度训练法则(MLE)和最大互信息训练法则(MMI),最小化音素错误训练能进-步降低音素错误率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号