首页> 中文学位 >基于RBF神经网络的汉语耳语音转换为正常语音的研究
【6h】

基于RBF神经网络的汉语耳语音转换为正常语音的研究

代理获取

目录

文摘

英文文摘

声明

第一章引言

1.1耳语音转换研究的目的和意义

1.2国内外耳语音转换研究的现状和发展

1.3耳语音转换的难点分析

1.4本文研究的主要工作

第二章耳语音的特点

2.1语音发音系统

2.2耳语音的特点

2.3本章小结

第三章语音信号生成的数学模型及耳语转换法概述

3.1语音信号生成的数学模型

3.1.1激励模型

3.1.2共振峰模型

3.1.3基于线性预测参数的声道合成器

3.1.4辐射模型

3.1.5语音信号的数学模型

3.2耳语音转换方法概述

3.2.1线性预测法

3.2.2同态信号处理方法

3.3本章小结

第四章RBF神经网络

4.1人工神经网络简介

4.2神经网络的特点

4.3 RBF神经网络

4.3.1 RBF神经网络模型

4.3.2 RBF网络的学习算法

4.4.RBF网络与多层感知器的比较

4.5本章小结

第五章基于RBF神经网络的耳语音转换系统的设计

5.1耳语音的预处理

5.2耳语音的端点检测

5.2.1 HHT和EMD的原理及实现

5.2.2 EMD拟合特征应用于耳语音端点检测算法

5.3线谱对参数的提取

5.4基于RBF神经网络的耳语音转换系统

5.5本章小结

第六章仿真结果与分析

6.1仿真结果

6.2转换耳语音质量的主客观评价及其结果分析

6.2.1语音质量的主观评价

6.2.2语音质量的客观评价

6.3本章小结

第七章总结与展望

7.1总结

7.2对下一步工作的展望

参考文献

攻读学位期间公开发表的论文

附录

致谢

展开▼

摘要

耳语音是一种有别于正常语音的发音模式。人们为了不影响他人或保证对话的保密性常使用耳语音。由于耳语发音的特殊性和受对话环境的影响,耳语发音不仅信噪比低而且可懂度和清晰度都很差,这既影响了对话的质量,又易使人产生疲劳。耳语音转换为正常语音可以解决这个问题。另外,此项技术也可用于帮助嗓音病人或发音功能不正常者进行正常的语音交流。 本文主要研究了基于RBF神经网络的耳语音转换为正常音的算法。主要工作包括: 在研究了耳语发音特点的基础上,对已有的转换方法如线性预测法、同态信号处理法作了研究。发现转换语音的可懂性和自然度都不高。 针对耳语音特征参数较正常语音发生了变化的特点,提出采用能够以任意精度逼近任意连续函数的径向基神经网络建立耳语音到正常语音的频谱包络映射关系,用以修正耳语音的线谱对参数。 首先对耳语音以及正常语音进行端点检测和声韵分割;分别提取耳语音以及正常语音韵母部分的线谱对参数,将耳语音的线谱对参数作为径向基神经网络的输入信号,正常语音的线谱对参数作为径向基神经网络的导师信号,通过训练建立耳语音到正常语音的转换模型;再通过此模型修正耳语音的线谱对参数,和语音基频平均值一起输入到线谱对参数合成器中;最后再和耳语音的声母连接,输出正常语音。 对几种耳语音的转换方法进行了仿真实验,分别采用主观以及客观的方法对转换语音进行了评价。实验结果表明采用本文方法转换的耳语音MOS得分为3.5,频谱失真距离变小。在可懂度和音质方面均达到了比较好的效果。 最后提出了本方法的缺点及未解决的问题,并给出了进一步研究的方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号