首页> 中文学位 >基于隐马尔可夫模型的汉语语音识别技术研究
【6h】

基于隐马尔可夫模型的汉语语音识别技术研究

代理获取

目录

文摘

英文文摘

学位论文的主要创新点

第一章 前言

1.1 选题的目的和意义

1.2 国内外语音识别研究的历史及现状

1.3 语音识别概述

1.3.1 语音识别分类

1.3.2 语音识别方法

1.4 本文研究内容

第二章 语音信号的预处理和端点检测

2.1 语音信号的预处理

2.1.1 语音信号的预滤波、采样、A/D转换

2.1.2 语音信号的预加重

2.1.3 加窗

2.2 语音信号的端点检测

2.2.1 短时能量

2.2.2 短时过零率

2.2.3 双门限检测法

2.2.4 基于Mel倒谱特征的带噪语音信号端点检测

第三章 特征参数提取及矢量量化

3.1 语音信号的线性预测分析

3.2 线性预测倒谱系数(LPCC)

3.3 Mel频率倒谱系数(MFCC)

3.4 改进的LPCCMel频率倒谱系数

3.5 矢量量化的基本原理

3.6 最佳矢量量化器的设计

3.7 矢量量化LBG算法

3.8 初始码本和码本容量的选取问题

3.8.1 初始码本的生成

3.8.2 码本容量的选取

第四章 基于DHMM的语音识别

4.1 隐马尔可夫模型

4.1.1 马尔可夫链

4.1.2 隐马尔可夫模型的基本概念与原理

4.1.3 前向概率和后向概率

4.2 HMM的结构和类型

4.2.1 按照HMM的状态转移概率矩阵分类

4.2.2 按照HMM的输出概率分布分类

4.3 隐马尔可夫模型的三个基本问题及其解决方法

4.3.1 隐马尔可夫模型的三个基本问题

4.3.2 概率P计算

4.3.3 最优状态序列搜索

4.3.4 隐马尔可夫模型的参数优化

4.4 隐马尔可夫模型的初值选择

4.5 隐马尔可夫模型实现的具体问题

4.5.1 下溢问题

4.5.2 多个观察矢量序列

第五章 仿真实验及结果分析

5.1 实验过程设计

5.1.1 预处理

5.1.2 端点检测

5.1.3 特征提取

5.1.4 矢量量化

5.1.5 DHMM训练

5.1.6 DHMM识别

5.2 实验结果分析

5.2.1 不同的特征参数识别结果

5.2.2 不同的码本容量识别结果

5.2.3 不同的HMM状态数识别结果

5.2.3 不同的HMM类型的识别结果

第六章 总结与展望

参考文献

发表论文和参加科研情况

致谢

展开▼

摘要

语音识别是机器通过模式识别过程把人类的语音信号转变为相应的文本的技术。语音识别拥有广阔的应用前景,同时作为一个交叉学科也具有深远的理论研究价值。
   本文首先分析了语音信号的预处理,对语音信号进行了端点检测,滤除了语音信号的无声段和噪声,为语音特征参数的提取提供了有效语音段。在端点检测方面讨论了基于Mel频率倒谱特征的端点检测方法和传统的双门限端点检测方法的性能。相对于传统的双门限端点检测方法,基于Mel频率倒谱特征的端点检测方法具有更高的鲁棒性。
   其次本文详细阐述了线性预测倒谱系数(LPCC)及Mcl频率倒谱系数(MFCC)特征参数的提取方法,并提出了改进的LPCCMel特征参数。仿真实验证明使用改进的LPCCMel特征参数的语音识别系统比使用LPCC参数和MFCC参数具有更好的识别率。
   最后,本文着重研究DHMM方法语音识别系统,分析、讨论语音识别系统中DHMM状态数选取和码本容量选取的问题。通过对“0-9”十个数字进行了识别实验,得出DHMM状态数为6或7,矢量量化的码本容量为64或128时,可以显著提高系统识别率的结论。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号