首页> 中文学位 >湖南方言语音信号特征提取及辨识
【6h】

湖南方言语音信号特征提取及辨识

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景及意义

1.2相关领域的研究进展

1.2.1基于声学处理的方法

1.2.2基于语音学的方法

1.3本文所做的工作和论文安排

第二章语音信号分析与特征提取

2.1语音信号的产生原理

2.1.1发音器官

2.1.2语音信号产生过程

2.1.3语音信号产生的数学模型

2.2语音信号的特性分析

2.2.1语音信号的声学特性

2.2.2语音信号时域特性分析

2.2.3语音信号频域特性分析

2.3语音信号的特征提取

2.3.1共振峰估计

2.3.2基音周期估计

2.3.3线性预测倒谱系数(LPCC)

2.3.4 Mel频率倒谱系数(MFCC)

2.4方言语音信号的特征分析实验及讨论

2.4.1共振峰特征提取与比较

2.4.2基音特征提取与比较

2.4.3 LPCC参数提取与比较

2.4.4 MFCC参数提取与比较

2.5本章小结

第三章基于动态时间规整和神经网络的辨识算法

3.1辨识系统方案

3.2动态时间规整

3.2.1时间规整网络结构

3.2.2时间规整网络算法

3.3人工神经网络的基本原理

3.3.1神经元

3.3.2网络的连接模式

3.3.3学习方式

3.3.4学习算法

3.4反向传播网络(BP网络)

3.4.1BP网络结构

3.4.2BP网络的算法

3.4.3BP网络的设计分析

3.5本章小结

第四章方言辨识系统实验仿真与分析

4.1方言语音信号的预处理

4.1.1预加重

4.1.2加窗分帧

4.1.3端点检测

4.2方言语音信号的特征提取及规整

4.3方言辨识系统评价指标

4.4神经网络的设计

4.5方言辨识结果与分析

4.5.1规整网络对方言辨识系统的影响

4.5.2不同声调字对方言辨识系统的影响

4.6本章小结

第五章结论与展望

参考文献

攻读学位期间发表的学术论文

致谢

展开▼

摘要

方言辨识是在已知一段发音所属语种的前提下,根据讲话者的发音判定其所属方言区域的一项技术,是非标准语音识别的基础,对语音识别技术的推广和应用有重要意义。目前相关的研究较少,此方面的研究不仅有利于提高方言语音识别系统的辨识率,而且对普通话评价、公安部门的刑事侦查等方面都有重要的价值。中国作为一个多民族多方言的大国,开展此方面的研究显得尤为必要。 本文以湖南方言作为研究对象,对方言语音信号特征的提取、不同方言特征的差异及方言辨识中特征参量的合适选取进行了深入研究。针对语音信号具有很强的随机性而神经网络的输入结构相对固定等特点,提出了基于动态时间规整和神经网络的辨识方法,并对各种因素对辨识率的影响进行了分析。论文主要做了以下工作: 1) 分别提取了湖南长沙、株洲、湘潭和衡阳等四地方言的声学特征,包括共振峰、基音周期、LPCC系数和MFCC系数,对不同方言间所含的不同的特征信息进行深入的分析,发现不同方言在同一特征参数下表现出不同的特性,从而找到了对不同方言进行辨识的依据。 2) 将不同方言所提取的不同特征参数经时间规整网络分别规整为48维后,作为BP网络的输入,发现选取不同特征参数对不同类方言和不同声调方言所得到的系统辨识率不一样。选取基音周期作为特征参数时,系统的平均辨识率为79.2%左右,选取LPCC系数作为特征参数时,系统的平均辨识率达到84.2%,选取MFCC系数作为特征参数时,系统平均辨识率可达到86.3%。 3) 对本文所提出的基于动态时间规整和神经网络的方言辨识系统的性能进行了分析,讨论了规整维数和隐含层神经元个数对系统辨识率的影响,实验结果表明:将输入参数规整为48维的辨识率要稍高于规整为36维的辨识率;隐含层神经元个数在10个时,辨识系统可以达到较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号