首页> 中文学位 >中等词汇量汉语连续语音识别技术研究
【6h】

中等词汇量汉语连续语音识别技术研究

代理获取

目录

文摘

英文文摘

独创声明及学位论文版权使用授权书

1绪论

1.1语音识别发展历史及国内外研究现状

1.2语音识别基本内容概述

1.3语音识别所面临的问题

1.4本文的主要内容安排

2语音识别基本原理

2.1语音信号的表示

2.1.1语音信号的时域波形

2.1.2语音信号的频域波形

2.2语音识别系统的结构

2.3语音信号处理

2.4语音信号特征参数提取

2.4.1语音信号的时域分析

2.4.2语音信号频域分析

2.4.3动态参数

3隐马尔科夫模型及其在语音识别中的应用

3.1隐马尔科夫模型主要特征

3.2隐马尔科夫模型的三个基本问题及其解决方法

3.2.1估值问题和前向—后向算法

3.2.2解码问题与Viterbi算法

3.2.3学习问题与Baum-Welch算法

3.3 HMM的分类

3.3.1根据状态转移矩阵的结构划分

3.3.2根据观测序列概率的不同划分

3.4 HMM在语音识别中的应用

3.4.1 HMM在孤立词识别中的应用

3.4.2 HMM在连续识别中的应用

3.5 HMM的局限

4实验与结论

4.1 HTK工具包简介

4.2实验过程

4.2.1数据准备

4.2.2 HMM定义及训练

4.2.3评价方法:

4.3实验内容及结果

4.3.1针对不同特征参数的实验及结果

4.3.2针对不同HMM状态数的实验及结果

4.3.3语音增强实验及结果

4.4实验结果分析

4.5实验的不足之处与解决方案

5总结与展望

5.1论文总结

5.2对未来工作的展望

参考文献

致谢

研究生阶段发表的论文

展开▼

摘要

语音识别的目的是让机器理解人的语言,实现更方便直接的人机交互。经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用。越来越多具有语音识别功能的产品进入人类的日常生活。 然而语音识别技术对环境的依赖性很强,语音识别系统通常是将在安静环境下训练得到的模板应用于实际环境中。而实际环境中一般都存在噪声,随着环境噪声的加大,识别性能将会急剧下降,这是因为噪声对语音识别的影响很大,而对噪声的处理比较困难,如何建立鲁棒性识别系统成为语音识别领域的重要研究课题。 本文介绍了语音识别的主要应用领域,国内外发展历史与研究现状,简要介绍了语音识别的基本方法及涉及到的关键技术,包括语音识别系统的分类、识别基元的选取以及模板训练与模式匹配的主要方法等。 分析语音识别系统的基本结构及涉及到的各种主要技术,讨论了语音信号的预处理及语音信号各种主要时、频域特征参数的提取,重点分析研究常用且效果良好的、反映语音倒谱特征的线性预测倒谱系数(LPCC)和美尔倒谱系数(MFCC)的提取方法。 隐马尔科夫模型用统计原理建立语音识别的声学模型,是目前语音识别的主流声学建模技术,本文重点介绍了隐马尔科夫模型的原理及其在语音识别中的应用,并探讨了其局限性。 最后在HTK平台上实现了中等词汇量特定人汉语连续语音识别的实验,验证了语音识别各个步骤的工作,提取出多种语音特征参数并对其进行对比实验以比较不同特征参数的识别效果;通过实验讨论HMM状态数的不同对识别率的影响;讨论基于最小统计谱减法的语音增强技术对加性噪声的抑制效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号