首页> 中文会议>第十一届全国人机语音通讯学术会议 >基于AAM和异步发音特征DBN 模型的逼真可视语音合成

基于AAM和异步发音特征DBN 模型的逼真可视语音合成

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文提出了一种基于主动外观模型(AAM)特征和异步发音特征DBN模型(AF_AVDBN)的逼真可视语音合成方法。在 AF_AVDBN模型中，发音特征（如嘴唇、舌体和声门/软腭的状态）之间允许在一定约束范围内异步，以更好地模拟协同发音现象，为人类真实发音过程建模。在模型训练中，以42维感知线性预测（PLP）特征作为音频特征，视频特征为嘴部图像的80维AAM特征。在听视觉数据库上训练好模型参数后，对于给定输入语音，基于期望值最大化（EM）算法推导出相应最优嘴部参数学习算法，并由学习得到的AAM特征重构出嘴部图像序列。在实验中，为30句连接词语音重构了嘴部动画，客观评价结果表明，与听视觉状态同步DBN模型（SS_DBN）和听视觉状态异步DBN模型（SA_DBN）相比，由AF_AVDBN模型学习得到的嘴部参数更加接近真实参数。对合成可视语音的主观评价结果表明，在模型中考虑听视觉之间的异步，会增加合成嘴部动画与语音之间的一致性，尤其是由AF_AVDBN模型，得到了非常准确、逼真、自然和清晰的可视语音。

著录项

来源
《第十一届全国人机语音通讯学术会议》|2011年|1-6|共6页
会议地点西安
作者
张贺; 蒋冬梅; 吴鹏; 谢磊; 付中华; Hichem Sahli;
展开▼
作者单位

中国中文信息学会;

中国声学学会;

中国语音学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音合成;数理语言学;
关键词
嘴部动画; 语音合成; DBN模型; 数理语言学;
入库时间 2022-08-17 11:13:11

相似文献

中文文献
外文文献
专利

1. 基于发音特征DBN模型的嘴部动画合成 [J] . 刘培桢 ,蒋冬梅 ,RAVYSE Ilse . 科学技术与工程 . 2010,第014期
2. 基于发音轨迹的可视语音合成 [J] . 郑红娜 ,白静 ,王岚 . 计算机应用与软件 . 2013,第006期
3. 基于改进异步DBN模型的听视觉融合情感识别 [J] . 张晓静 ,蒋冬梅 ,FAN Ping . 计算机工程与应用 . 2014,第021期
4. 一种基于双重学习模型的可视语音合成系统 [J] . 孙艳丰 ,林仙平 ,尹宝才 . 北京工业大学学报 . 2009,第005期
5. 基于两层隐马尔可夫模型的可视语音合成 [J] . 尹宝才 ,李敬华 ,贾熹滨 . 北京工业大学学报 . 2006,第005期
6. 可视语音合成中基于音视频关联模型的视位参数优化 [C] . 吴志勇 ,蔡莲红 ,蒙美玲 . 第八届全国人机语音通讯学术会议（NCMMSC8) . 2005
7. 基于发音动作特征的中文语音合成系统研究与实现 [A] . 尹晴 . 2019

基于AAM和异步发音特征DBN 模型的逼真可视语音合成

摘要

著录项

相似文献

相关主题

期刊订阅