基于多流多状态动态贝叶斯网络的音视频连续语音识别

吕国云; 蒋冬梅; 张艳宁; 赵荣椿; H Sahli; Ilse Ravyse; W Verhelst

首页> 中文期刊> 《电子与信息学报》 >基于多流多状态动态贝叶斯网络的音视频连续语音识别

基于多流多状态动态贝叶斯网络的音视频连续语音识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

语音和唇部运动的异步性是多模态融合语音识别的关键问题,该文首先引入一个多流异步动态贝叶斯网络(MS-ADBN)模型,在词的级别上描述了音频流和视频流的异步性,音视频流都采用了词-音素的层次结构.而多流多状态异步DBN(MM-ADBN)模型是MS-ADBN模型的扩展,音视频流都采用了词-音素-状态的层次结构.本质上,MS-ADBN是一个整词模型,而MM-ADBN模型是一个音素模型,适用于大词汇量连续语音识别.实验结果表明：基于连续音视频数据库,在纯净语音环境下,MM-ADBN比MS-ADBN模型和多流HMM识别率分别提高35.91%和9.97%.

著录项

来源
《电子与信息学报》 |2008年第12期|2906-2911|共6页
作者
吕国云; 蒋冬梅; 张艳宁; 赵荣椿; H Sahli; Ilse Ravyse; W Verhelst;
展开▼
作者单位

西北工业大学计算机学院,西安,710072;

西北工业大学计算机学院,西安,710072;

西北工业大学计算机学院,西安,710072;

西北工业大学计算机学院,西安,710072;

布鲁塞尔自由大学电子与信息处理系,布鲁塞尔,B-1050,比利时;

布鲁塞尔自由大学电子与信息处理系,布鲁塞尔,B-1050,比利时;

布鲁塞尔自由大学电子与信息处理系,布鲁塞尔,B-1050,比利时;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP391.42;
关键词
语音识别; 动态贝叶斯网络; 音视频; 多流异步;

相似文献

中文文献
外文文献
专利

1. 基于多流动态贝叶斯网络的音视频连续语音识别 [J] . 吕国云 ,蒋冬梅 ,赵荣椿 . 西北工业大学学报 . 2008,第004期
2. 基于动态贝叶斯网络的音视频连续语音识别和音素切分 [J] . 吕国云 ,蒋冬梅 ,蒋晓悦 . 计算机应用 . 2007,第007期
3. 基于三音素动态贝叶斯网络模型的大词汇量连续语音识别 [J] . 吕国云 ,赵荣椿 ,张艳宁 . 数据采集与处理 . 2009,第001期
4. 基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 [J] . 吕国云 ,蒋冬梅 ,张艳宁 . 西北工业大学学报 . 2008,第002期
5. 基于动态贝叶斯网络的连续语音识别框架及其Token传递模型 [J] . 苗夺谦 ,王睿智 ,冉巍 . 计算机研究与发展 . 2008,第011期
6. 基于动态贝叶斯网络的连续语音识别 [C] . 孙阿利 ,蒋冬梅 ,吕国云 . 第五届全国“信号与信息处理”联合学术会议暨陕西省生物医学工程学会二〇〇六年学术年会 . 2006
7. 基于动态贝叶斯网络的音视频语音识别模型研究 [A] . 孙阿利 . 2007

基于多流多状态动态贝叶斯网络的音视频连续语音识别

摘要

著录项

相似文献

相关主题

期刊订阅