基于语音反演机器学习方法的声道模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

由于协同发音的影响，自动语音识别系统的性能会受到影响。已有的研究表明结合发音信息可以提高语音识别系统的性能，但是发音信息在话音环境中并不容易得到，因此语音反演被提了出来。语音反演是一种从语音信号中预测发音轨迹或者声道配置的方法。如果能够准确地预测发音信息，这些发音信息还能有助于语音合成、语言获取以及语音可视化等。
　　论文首先提出使用声道变量作为发音信息（代替传统的球状轨迹）来模式化语音动态，并比较了声道变量和球状轨迹的预测性能和非唯一性。论文将语音分别参数化为梅尔倒谱系数，感知线性预测倒谱系数和线性预测倒谱系数，并使用混合密度网络来预测声道变量和球状轨迹。实验结果表明声道变量比球状轨迹能被更准确地预测。另外，论文使用基于模型的统计公式计算声道变量和球状轨迹的标准化的非唯一性，结果表明对于相同的六个辅音，声道变量的非唯一性比球状轨迹的非唯一性低。
　　论文另一个研究内容为使用四种不同的语音反演的机器学习方法，即前馈人工神经网络、自回归人工神经网络、远端监督学习以及轨迹混合密度网络比较声道变量和球状轨迹，结果表明声道变量比球状轨迹有更好的性能，更适合基于发音器官特征的自动语音识别系统。另外论文分别将语音参数化为梅尔倒谱系数和声学参数，并比较了这四种方法对声道变量的预测性能，结果表明从整体来看三层隐层的前馈人工神经网络对声道变量的预测性能最好。

著录项

作者
陈英;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科计算机应用技术
授予学位硕士
导师姓名张少白;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;自动推理、机器学习;
关键词
语音反演技术; 机器学习方法; 声道模型; 工作原理; 预测性能;

相似文献

中文文献
外文文献
专利

1. 基于树模型机器学习方法的GNSS-R海面风速反演 [J] . 骆黎明 ,白伟华 ,孙越强 . 空间科学学报 . 2020,第004期
2. 基于紫外⁃可见光谱和机器学习方法的溶解性有机质吸附预测模型研究 [J] . 崔鹤 ,刘昆 ,瞿晓磊 . 南京大学学报:自然科学版 . 2021,第3期
3. 基于机器学习方法的母猪高低产分类模型研究 [J] . 李喜阳 ,李信颉 ,赵志超 . 华中农业大学学报 . 2021,第3期
4. 基于机器学习方法的上市公司财务预警模型对比研究 [J] . 李星辰 ,王青龙 ,林国庆 . 商场现代化 . 2020,第007期
5. 基于机器学习方法的小微企业融资特征分析研究——关于嘉兴市33305家小微企业的SVM模型实证分析 [J] . 沈彦菁 ,张榕薇 ,朱维聪 . 金融经济 . 2019,第10期
6. 基于机器学习方法对蒸发波导预测模型的优化研究 [C] . ZHU Xiaoyu ,朱啸宇 ,ZHU Min . 第十四届全国电波传播学术讨论年会 . 2017
7. 基于DIVA模型的语音生成与获取声道模型及其控制机制的研究 [A] . 张昕 . 2012

基于语音反演机器学习方法的声道模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅