基于多流三音素DBN模型的音视频语音识别和音素切分

吕国云; 蒋冬梅; 樊养余; 赵荣椿; H.Sahli; W.Verhelst

首页> 中文期刊>电子与信息学报 >基于多流三音素DBN模型的音视频语音识别和音素切分

基于多流三音素DBN模型的音视频语音识别和音素切分

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象.实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能.

著录项

来源
《电子与信息学报》|2009年第2期|297-301|共5页
作者
吕国云; 蒋冬梅; 樊养余; 赵荣椿; H.Sahli; W.Verhelst;
展开▼
作者单位

西北工业大学,西安,710072;

西北工业大学,西安,710072;

西北工业大学,西安,710072;

西北工业大学,西安,710072;

布鲁塞尔自由大学电子与信息处理系,布鲁塞尔,B-1050,比利时;

布鲁塞尔自由大学电子与信息处理系,布鲁塞尔,B-1050,比利时;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP391.42;
关键词
语音识别; 动态贝叶斯网络; 音素切分; 音视频;

相似文献

中文文献
外文文献
专利

1. 基于动态贝叶斯网络的音视频连续语音识别和音素切分 [J] . 吕国云 ,蒋冬梅 ,蒋晓悦 . 计算机应用 . 2007,第007期
2. 基于上下文三音素DBN模型的连续语音识别 [J] . 吕国云 ,赵荣椿 ,蒋冬梅 . 计算机工程与应用 . 2007,第035期
3. 基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 [J] . 吕国云 ,蒋冬梅 ,张艳宁 . 西北工业大学学报 . 2008,第002期
4. 基于动态贝叶斯网络的语音识别及音素切分研究 [J] . 孙阿利 ,蒋冬梅 ,吕国云 . 计算机应用研究 . 2007,第010期
5. 基于三音素动态贝叶斯网络模型的大词汇量连续语音识别 [J] . 吕国云 ,赵荣椿 ,张艳宁 . 数据采集与处理 . 2009,第001期
6. 基于音素模型的连续汉语语音识别研究 [C] . 苏岭 . 第六届全国汉字识别学术会议 . 1996
7. 基于HMM的普通话连续语流中音素的自动切分 [A] . 郑鸿 . 2002

基于多流三音素DBN模型的音视频语音识别和音素切分

摘要

著录项

相似文献

相关主题

期刊订阅