基于LD特征引导NeRF的可操控语音驱动人脸重演

郑迦恒; 余盛叶; 谢志峰

首页> 中文期刊> 《工业控制计算机》 >基于LD特征引导NeRF的可操控语音驱动人脸重演

基于LD特征引导NeRF的可操控语音驱动人脸重演

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

语音驱动的人脸重演的目标是通过输入一段任意语音,驱动目标人物重演相应表情。现有方法无法仅以一段自然场景下视频作为训练素材,实现可操控的高保真语音驱动人脸重演,为此,提出了一种基于LD特征的语音驱动人脸重演方法。首先,对输入视频进行人脸对齐,检测人脸关键点并提取LD特征;然后,通过音频特征提取模块将输入音频映射为一段64维的潜码,构建基于多层感知机的编码器和解码器,由解码器将潜码解码为LD特征后,通过编码器将其还原为潜码表示;接着,将更新后的潜码输入基于网格的NeRF获得采样点密度和颜色,通过体绘制输出头部重演RGB帧;同时,将姿势输入身体变形模块,合成重演帧的身体部分。实验结果证明,方法能够根据输入语音内容生成高保真重演结果,并且在重演过程中能够对目标人物的面部表情进行个性化控制。

著录项

来源
《工业控制计算机》 |2023年第10期|58-60|共3页
作者
郑迦恒; 余盛叶; 谢志峰;
展开▼
作者单位

上海大学影视工程系;

上海电影特效工程技术研究中心;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
语音驱动人脸重演; 神经辐射场; 人脸关键点;

相似文献

中文文献
外文文献
专利

1. 基于LD3320语音识别和KS2A242人脸识别的智能实验室管理研究 [J] . 赵云鸿 ,马振伟 ,李贵 . 电子世界 . 2020,第4期
2. 人脸与语音识别技术的拖拉机操控系统研究 [J] . 王喆 . 农机化研究 . 2021,第11期
3. 基于语音驱动的三维人脸动画技术综述 [J] . 刘贤梅 ,刘露 ,贾迪 . 计算机系统应用 . 2022,第10期
4. 基于关键点表示的语音驱动说话人脸视频生成 [J] . 年福东 ,王文涛 ,王妍 . 模式识别与人工智能 . 2021,第6期
5. 基于汉语文本驱动的人脸语音同步动画系统 [J] . 杜鹏 ,房宁 ,赵群飞 . 计算机工程 . 2012,第13期
6. 基于非线性核函数映射方法的人脸视觉语音特征区域定位 [C] . 蒙山 ,张有为 . 中国航空学会信号与信息处理专业第六届学术会议 . 2002
7. 基于人脸表情特征与语音特征融合的情感识别 [A] . 韩金秋 . 2017

基于LD特征引导NeRF的可操控语音驱动人脸重演

摘要

著录项

相似文献

相关主题

期刊订阅