基于Bi-LSTM的面部特征与语音特征的映射模型

刘奕; 金小峰

首页> 中文期刊>延边大学学报（自然科学版） >基于Bi-LSTM的面部特征与语音特征的映射模型

基于Bi-LSTM的面部特征与语音特征的映射模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对人脸动画技术中的面部特征与语音特征的映射问题,提出了一种基于双向长短时记忆网络(Bi-LSTM)的映射模型学习方法.首先,在训练视频中同步地分别提取语音信号的MFCC参数和视频帧序列中的人脸特征点参数.其次,训练映射模型过程中将MFCC参数作为Bi-LSTM网络的输入,将面部特征参数作为网络的期望输出,并引入参数调优机制对迭代次数、隐层单元数、批处理大小、优化器类型等进行实验调优,以此得到最优的映射模型.对最优映射模型进行实验结果表明,采用双向Bi-LSTM网络明显优于单向的LSTM网络,而且经过参数调优后映射准确率达到0.895;因此,本文方法可以为后续的基于语音驱动的人脸视频合成应用提供有效的人脸特征预测参数.

著录项

来源
《延边大学学报（自然科学版）》|2020年第3期|215-220|共6页
作者
刘奕; 金小峰;
展开▼
作者单位

延边大学工学院吉林延吉133002;

延边大学工学院吉林延吉133002;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
人脸动画; 梅尔频率倒谱系数; 双向长短时记忆网络; 参数调优;
入库时间 2023-07-25 23:24:06

相似文献

中文文献
外文文献
专利

1. 基于声门特征与语音特征的语音情感识别对比研究 [J] . 朱智豪 ,郑徵羽 ,肖仲喆 . 电声技术 . 2020,第005期
2. 基于空间特征的BI-LSTM人体行为识别 [J] . 付仔蓉 ,吴胜昔 ,吴潇颖 . 华东理工大学学报（自然科学版） . 2021,第002期
3. 基于局部最大概率特征和映射模型学习的行人再识别 [J] . 胡正平 ,张敏姣 ,李淑芳 . 高技术通讯 . 2018,第003期
4. 四川省智慧城市发展水平和路径研究——基于自组织特征映射模型和社会网络技术的分析 [J] . 卢奕 ,卢东 ,谢至 . 资源开发与市场 . 2017,第007期
5. 基于特征映射模型的输变电工程造价风险因素识别 [J] . 章昀玥 ,张云宁 ,蔡骋 . 武汉理工大学学报（信息与管理工程版） . 2016,第004期
6. 基于面部特征构建中医望诊面部二维坐标体系 [C] . 李灿东 ,蔡艺芳 . 中国中西医结合学会诊断专业委员会2009年会 . 2009
7. 基于人脸表情特征与语音特征融合的情感识别 [A] . 韩金秋 . 2017

基于Bi-LSTM的面部特征与语音特征的映射模型

摘要

著录项

相似文献

相关主题

期刊订阅