首页> 中文学位 >采用线谱对参数和BP神经网络进行病理嗓音修复的研究
【6h】

采用线谱对参数和BP神经网络进行病理嗓音修复的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 病理嗓音修复研究的目的和意义

1.2 国内外的研究现状

1.3 本课题的难点分析

1.4 本文研究的主要工作

第二章 病理嗓音的相关理论基础

2.1 嗓音发音系统的生理组成

2.2. 嗓音生成的数学模型

2.3 病理嗓音的特点

2.4 转换质量评价

2.5 本章小结

第三章 采用声学分析的病理嗓音识别及修复研究

3.1 病理嗓音识别与修复研究概述

3.2 基于归一化Poly核函数支持向量机算法的病理嗓音识别

3.3 病理嗓音识别在修复系统中的应用

3.4 本章小结

第四章 采用线谱对参数和BP神经网络建立病理嗓音修复系统

4.1 采用线谱对参数和BP神经网络的病理嗓音修复系统介绍

4.2 病理嗓音激励源的修复

4.3 病理嗓音声道谱参数的修复

4.4 基于BP神经网络的线谱对参数修复及共振峰重构

4.5 基于线谱对参数的声道合成器

4.6 本章小结

第五章 仿真结果与分析

5.1 本文采用的数据库

5.2 基于归一化Poly核参数SVM的病理嗓音识别实验结果

5.3 采用线谱对参数和BP神经网络病理嗓音修复的实验结果

5.4 修复语音质量评价

5.5 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读学位期间公开发表的论文

致谢

展开▼

摘要

病理嗓音(Pathological voice)的自动识别检测在临床上已经成为某些重大疾病预防及早期诊断的重要手段,本文首先采用基于归一化 Poly核函数的支持向量机(SVM)算法进行病理嗓音的识别,并在此基础上提出了采用线谱对参数和误差反向传播神经网络的方法重建共振峰,以修复病理嗓音。结合病理嗓音的频谱特性,使修复后的语音能够帮助有嗓音疾病的患者进行正常的交流,具有广泛的应用价值。
  针对病理嗓音的基音频率不稳定的特点,首先求取目标语音与源语音的基音周期比值作为变换率系数,并根据该系数获取修复嗓音的基音频率,实验证明采用该方法的转换模型,即使在基音缺失的情况下也能进行重构造,为下一步嗓音修复提供稳定的激励源。
  针对共振峰不规则、断裂甚至消失的特点,相对应的10阶与共振峰配对特性好的线谱对参数(LSP)作为声道谱参数。LSP稳定性高且具有良好的量化特性和插值特性,适用于共振峰出现偏移、缺失等情况,同时与误差反向传播(BP)神经网络结合建模,根据训练后BP神经网络输出的LSP来对共振峰进行重构建,并进行嗓音修复合成。
  最后进行仿真实验,分别用主观和客观方法对修复后的嗓音进行评价。通过实验发现,本文方法对病理嗓音进行修复后MOS得分较高,线谱对参数距离测度、板仓-斋田谱失真测度以及MFCC失真测度等频谱失真测度明显变小。在可懂度和音质方面都达到了比较满意的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号