首页> 中文会议>中国航空学会信号与信息处理专业第六届学术会议 >驱动说话人头部动画的连续语音识别系统

驱动说话人头部动画的连续语音识别系统

摘要

为实现听觉/视觉驱动的说话人头部动画,本文建立了一个基于viseme(视觉领域的语音基本单位)的连续语音识别系统,它采用triseme的概念来考虑viseme的上下文相关性,识别语音为viseme图像序列.根据viseme图像及其相似度权值(VSW),本文定义了有166个问题的视觉问题集,用来建立triseme决策树,以实现triseme的状态捆绑及HMM参数共享.为比较系统性能,还定义了viseme图像相似度加权识别精度,并用嘴形圆度和VSW曲线中的突变点来评估说话人头部动画的平滑性.结果表明,与基于phoneme(听觉领域的语音基本单位)的系统相比,本文基于viseme的语音识别系统能给出更平滑和合理的嘴形图像序列和说话人头部动画.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号