首页> 中文学位 >基于DIVA模型的中英文发音方法研究
【6h】

基于DIVA模型的中英文发音方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题研究背景及意义

1.2 国内外研究现状

1.3 本文研究内容及论文结构

第2章 DIVA模型和神经网络基本理论

2.1 DIVA模型

2.2 神经网络模型

2.3 隐马尔可夫训练学习模型

2.4 本章小结

第3章 基于DIVA模型的中文复合元音发音

3.1 隐马可夫语音训练学习方法的研究

3.2 DIVA模型中发音方法的研究

3.3 DIVA模型中复合元音发音特征的考虑

3.4 本章小结

第4章 实验与方法

4.1 HMM/PNN混合模型仿真实验

4.2 应用DIVA模型提取语音特征

4.3 本章小结

第5章 结果与讨论

5.1 混合模型的实验结果及分析

5.2 汉语复合元音发音仿真

5.3 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

附录1 攻读硕士学位期间撰写的论文

附录2 攻读硕士学位期间参加的科研项目

致谢

展开▼

摘要

具有语音生成和获取能力的DIVA(Directions Into Velocities of Articulators)模型是以英文的29个基本音素为研究对象的神经计算模型,但这样会使模型不能适应于其他的语言,具有一定的局限性。本文研究的目的是将该模型的理论扩展至其他语种,如相较英文更为复杂的中文发音。由于中英文的音素数目和发音脑机制均相差甚远,原有的模型只适用于英语者的脑机制,只能对英语元音进行发音,且原始的学习训练算法不能很好地识别中文发音,故本文在原始模型的基础上进行改进使之适用于中文发音。
  本文首先简述了DIVA模型的基本原理和两个学习阶段,探讨了汉语复合元音的声学特性,并展示其共振峰频率走势图。在已知英文辅音/r/与/l/的辨别结论以及英文元音听觉感知空间理论的基础上,深入研究中文元音的发音及感知空间。在模型发出汉语单元音的基础上,通过改进DIVA模型的训练学习算法,调整训练参数,结合隐马尔可夫和神经网络的混合模型以及共振峰提取方法(Linear Prediction and Mel Frequency Cepstrum Coefficient, LPMCC)研究DIVA模型中汉语复合元音的发音。最终证明了改进后的DIVA模型在英文元音发音的基础上不仅可以学习中文单元音,而且也适用于中文复合元音的发音。
  本文的研究为今后应用DIVA模型进行汉语语音生成与获取奠定了良好的基础,未来还可将其拓展至汉语所独有的发音(如辅音/zh/、/ch/、/sh/等)。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号