Visemes' transcription; Speech segmentation; Time vector extraction; Static viseme; Dynamic visemes generation;
机译:统计参数化方法,用于视频逼真的文本驱动的说话头像
机译:使用发音模型对语音驱动的说话人脸进行逼真的嘴部同步
机译:谈话文本:评估针对语音和语言延迟的移动健康计划
机译:文字和语音共同驱动的3D现实说话面孔
机译:被遗忘的权利或未被谈论的权利?交互式网络上的公共和私人语音监管以及关于批评性语音的恐慌。
机译:清晰语音中的视觉语音收益取决于讲话者的听觉清晰度和背景讲话者的数量
机译:Image Talk:一个具有中文文本语音能力的单一图像的实时合成会说话头