首页> 中文学位 >基于神经网络的汉语数码语音识别技术研究
【6h】

基于神经网络的汉语数码语音识别技术研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1选题的背景和意义

1.2语音识别技术的发展和现状

1.2.1国外语音识别技术的发展

1.2.2国内语音识别技术的发展

1.3汉语数码语音识别的主要问题和困难

1.4本文研究内容及章节安排

第二章语音识别的基本原理与技术

2.1语音信号产生的数学模型

2.2语音识别系统的分类和结构

2.2.1语音识别系统的分类

2.2.2语音识别系统的结构

2.3语音信号的预处理

2.3.1语音信号的预加重

2.3.2加窗分帧处理

2.4语音的端点检测

2.4.1短时平均能量

2.4.2短时平均过零率

2.4.3自相关函数分析

2.4.4双门限语音端点检测

2.5语音信号特征参数的提取

2.5.1线性预测倒谱参数

2.5.2 Mel频率倒谱系数

2.5.3前端时间规整类网络的原理、结构和算法

2.6本章小结

第三章基于神经网络的语音识别方法

3.1人工神经网络的基本概念

3.1.1神经元

3.1.2神经网络的拓扑结构

3.1.3神经网络的训练(学习)算法

3.2多层感知器和BP算法

3.2.1多层感知器网络结构模型

3.2.2BP神经网络算法研究

3.2.3BP神经网络的缺陷及改进措施

3.3径向基函数神经网络

3.3.1径向基函数神经网络拓扑结构及其特点

3.3.2 RBF神经网络的训练方法及分析

3.3.3改进的RBF网络学习方法

3.4自组织神经网络

3.4.1自组织神经网络的训练

3.4.2自组织神经网络的改进和模式标识

3.5神经网络在语音建模中的主要应用

3.5.1网络设计的原则和准则

3.5.2网络的设计分柝(以BP网络为例)

3.6本文的神经网络建模方法

3.7本章小结

第四章实验仿真及结果分析

4.1仿真实验原理

4.2基于Matlab7.0的算法仿真

4.2.1语音样本库的建立

4.2.2语音的预处理

4.2.3语音信号的特征提取

4.2.4语音特征参数分析与识别性能比较

4.2.5语音识别方法间识别性能对比分析

4.3神经网络的识别方法的性能分析

4.3.1训练次数对识别性能的影响

4.3.2训练样本数目对识别性能的影响

4.3.3观测噪声的影响

4.4基于C++的软件设计

4.4.1语音识别神经网络系统类层次图

4.4.2语音识别过程序列图

4.5本章小结

第五章结束语

5.1主要工作回顾

5.2未来工作展望

参考文献

附录

致谢

展开▼

摘要

语音识别是一个复杂的非线性过程,基于线性系统理论的语音识别方法如隐马尔可夫(HMM)模型等技术的局限性逐渐凸现。随着人工神经网络的非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。因此,本文将以神经网络为基础,引入MFCC与LPCC混合参数来进行语音识别的研究。 本文主要研究了基于神经网络的数码语音识别。对语音识别的预处理、特征提取与识别算法等环节进行了计算验证、性能分析和结果评述。对本文所使用到的几种识别方法的识别性能与应用特点进行了比较,分析讨论了在语音识别研究中神经网络的设计原则以及不同的特征参数等方面对语音识别结果的影响,研究构造了相应的语音识别模型与算法,并完成了实验软件平台的设计与开发。通过仿真计算,比较了相应算法的识别性能及应用特点,分析讨论了不同特征参数、训练样本数目、背景噪声以及是否特定人对识别结果的影响,结果表明,基于MFCC与LPCC混合参数比传统单一的MFCC参数或LPCC参数的语音识别方法具有更好的识别性能,神经网络识别方法有较高的识别率和独到的应用前景。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号