首页> 中文会议>中国航空学会信号与信息处理专业第六届学术会议 >驱动说话人头部动画的连续语音识别系统

驱动说话人头部动画的连续语音识别系统

页面导航

摘要
著录项
相似文献
相关主题

摘要

为实现听觉/视觉驱动的说话人头部动画,本文建立了一个基于viseme(视觉领域的语音基本单位)的连续语音识别系统,它采用triseme的概念来考虑viseme的上下文相关性,识别语音为viseme图像序列.根据viseme图像及其相似度权值(VSW),本文定义了有166个问题的视觉问题集,用来建立triseme决策树,以实现triseme的状态捆绑及HMM参数共享.为比较系统性能,还定义了viseme图像相似度加权识别精度,并用嘴形圆度和VSW曲线中的突变点来评估说话人头部动画的平滑性.结果表明,与基于phoneme(听觉领域的语音基本单位)的系统相比,本文基于viseme的语音识别系统能给出更平滑和合理的嘴形图像序列和说话人头部动画.

著录项

来源
《中国航空学会信号与信息处理专业第六届学术会议》|2002年|266-269|共4页
会议地点昆明
作者
蒋冬梅; 谢磊; 赵荣椿;
展开▼
作者单位

中国航空学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音识别与设备;
关键词
说话人头部动画; viseme; triseme决策树; viseme图像相似度加权; 语言识别;

相似文献

中文文献
外文文献
专利

1. 一种用于说话人头部动画的Viseme语音识别系统 [J] . 谢磊 ,赵荣椿 ,蒋冬梅 . 计算机应用与软件 . 2004,第005期
2. 基于MFCC的说话人语音识别系统的研究 [J] . 于树本 . 黑龙江科技信息 . 2015,第027期
3. 基于嵌入式系统的特定说话人语音识别系统的实现 [J] . 刘濛 ,杨康 ,崔向 . 沈阳理工大学学报 . 2006,第004期
4. 隧道连续皮带机头部三滚筒驱动特性分析 [J] . 徐会敢 ,秦庆华 ,宋朋洋 . 起重运输机械 . 2019,第018期
5. 基于OMAP5912的嵌入式非特定人连续语音识别系统 [J] . 崔金芳 ,张雪英 ,白静 . 电声技术 . 2009,第009期
6. 语音驱动说话人头部中的基于决策树的Triseme建模方法 [C] . 谢磊 ,蒋冬梅 ,赵荣椿 . 中国航空学会信号与信息处理专业第六届学术会议 . 2002
7. 手语韵律驱动的虚拟人头部动画研究 [A] . 宋汉营 . 2009

驱动说话人头部动画的连续语音识别系统

摘要

著录项

相似文献

相关主题

期刊订阅