首页> 中文学位 >基于深度学习网络模型实现语音驱动的人脸动画合成

【6h】

基于深度学习网络模型实现语音驱动的人脸动画合成

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

致谢

1 引言

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 语音驱动的人脸动画生成研究现状

1.2.2 视频与音频映射的研究现状

1.3 研究目标以及内容

1.3.1 研究目标

1.3.2 研究内容

1.4 本文组织结构

2 本文相关的深度神经网络理论基础

2.1 卷积神经网络基本原理

2.1.1 卷积神经网络的网络结构

2.2 循环神经网络基本原理

2.2.1 循环神经网络的网络结构

2.2.2 长短时记忆网络

2.3 CGAN 网络基本原理

2.4 本章小结

3 项目总体设计及数据集设计

3.1 语音驱动的人脸动画项目总体设计

3.2 数据集设计

3.2.1 FFFmepg 处理视频与音频数据

3.2.2 语音数据特征提取

3.2.3 提取面部特征点

3.3 数据集划分

3.4 本章小结

4 CNN-LSTM 网络的设计与实现

4.1 CNN-LSTM 网络设计

4.1.1 CNN-LSTM 网络的流程设计

4.1.2 CNN-LSTM 网络的结构设计

4.2 CNN-LSTM网络参数调整

4.3 实验结果以及分析

4.3.1 实验环境

4.3.2 实验评价方法

4.3.3 实验结果

4.4 实验结果分析

4.5 本章小结

5 条件生成对抗网络的设计与实现

5.1 条件生成对抗网络设计

5.2 生成器与判别器的实现

5.2.1 生成网络的实现

5.2.2 判别网络的实现

5.3 实验环境

5.4 实验结果以及分析

5.4.1 实验评价方法

5.4.2 实验结果

5.5 本章小结

6 结论与未来展望

6.1 结论

6.2 未来展望

参考文献

作者简历及攻读硕士/博士学位期间取得的研究成果

独创性声明

学位论文数据集

展开▼

著录项

作者
岳旸;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科软件工程
授予学位硕士
导师姓名高睿鹏;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类 TP3TP1;
关键词

相似文献

中文文献
外文文献
专利

1. 基于数据挖掘的语音驱动三维人脸动画合成 [J] . 陈益强 ,高文 ,王兆其 . 系统仿真学报 . 2002,第4期
2. 一种基于共振峰分析的语音驱动人脸动画方法 [J] . 潘晋 ,杨卫英 . 电声技术 . 2009,第005期
3. 基于机器学习的语音驱动人脸动画方法 [J] . 陈益强 ,高文 ,王兆其 . 软件学报 . 2003,第002期
4. 基于数据驱动的人脸动画合成技术的研究与发展 [J] . 孙延鹏 ,傅蓉 ,孙海伦 . 计算机工程与科学 . 2009,第001期
5. 基于双层码本的语音驱动视觉语音合成系统 [J] . 贾熹滨 ,尹宝才 ,孙艳丰 . 计算机科学 . 2014,第001期
6. 基于医学影像的语音驱动舌位运动合成 [C] . Dawei Zhang ,张大伟 ,Minghao Yang . 第十四届全国人机语音通讯学术会议 . 2017
7. 基于文本/语音驱动的高自然度人脸动画生成 [A] . 于灵云 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号