超帧特征空间下基于深度置信网络的语音转换

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音转换的目的是在保持语义内容不变的前提下，将源说话人语音的个性特征改变，转换成具有目标说话人个性特征的语音，使得听起来像目标说话人的发音。语音转换技术的研究是语音信号处理领域一个比较重要的分支，它可以促进语音合成、语音编码等领域的研究，同时也有着广泛的应用前景。目前比较主流的语音转换方法是基于高斯混合模型（GMM）的转换方法，该方法虽然可以取得较好的语音转换效果，但是由于GMM方法假设各个语音参数帧之间是统计独立，忽略了语音相邻帧之间的相关性，从而使转换后的语音有一定的不连续，其次，由于传统的GMM模型在语音的参数化表达下对特征矢量进行加权平均，必然会引起参数的过平滑。
　　本文提出了一种超帧特征空间下基于深度置信网络（DBN-Sf,Deep Belief Nets in Super-frame feature space）的语音转换方法，它是将深度置信网络构成的深度神经网络作为回归模型来映射源和目标说话人频谱参数之间的非线性关系。首先利用STRAIGHT提取说话人的基频和短时谱参数，从短时谱参数中求得对应的LPCC参数，利用动态时间规整将源和目标说话人的特征参数进行对齐，通过扩展源说话人当前的语音帧来构建超帧信息作为网络的输入，目标说话人对应的当前帧作为网络的输出，经训练得到短时谱转换函数。实验结果显示，使用该方法的转换语音在谱失真、目标倾向性和语音质量等方面均优于传统的高斯混合模型方法，转换语音的平均谱失真度相对于传统的GMM方法降低了9.5％。

著录项

作者
叶伟;
展开▼
作者单位

苏州大学;

展开▼
授予单位苏州大学;
学科信息与通信工程
授予学位硕士
导师姓名俞一彪;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音信号处理;
关键词
深度置信网络; 语音转换; 超帧特征; 频谱参数; 高斯混合模型;

相似文献

中文文献
外文文献
专利

1. 基于IEEE802.15.4B规范超帧机制下的230MHz无线专网系统改造方案 [J] . 姚钢 . 数字技术与应用 . 2011,第002期
2. 基于IEEE802.15.4B规范超帧机制下的230MHz无线专网系统改造方案 [J] . 姚钢 . 数字技术与应用 . 2011,第002期
3. 基于不同积分时间帧累加的红外图像超帧方法 [J] . 洪闻青 ,姚立斌 ,姬荣斌 . 光学精密工程 . 2016,第006期
4. 基于Style-CycleGAN-VC的非平行语料下的语音转换 [J] . 高俊峰 ,陈俊国 . 计算机应用与软件 . 2021,第009期
5. 非平行文本下基于变分自编码器和辅助分类器生成对抗网络的语音转换 [J] . 李燕萍 ,曹盼 ,石杨 . 复旦学报：自然科学版 . 2020,第3期
6. 考虑帧间信息的语音转换算法 [C] . JIAN Zhi-hua ,简志华 ,WANG Xiang-wen . 浙江省信号处理学会2012学术年会 . 2012
7. 基于帧间缝络和超像素匹配的联合目标分割方法 [A] . 温子锐 . 2019

超帧特征空间下基于深度置信网络的语音转换

目录

摘要

著录项

相似文献

相关主题

期刊订阅