基于发音特征的音视频说话人识别鲁棒性的研究

陈雁翔; 刘鸣

首页> 中文期刊>电子学报 >基于发音特征的音视频说话人识别鲁棒性的研究

基于发音特征的音视频说话人识别鲁棒性的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

人类对语音的感知是多模态的,会同时受到听觉和视觉的影响.以语音及其视觉特征的融合为研究核心,依据发音机理中揭示的音视频之间非同步关联的深层次成因,采用多个发音特征的非同步关联,去描述表面上观察到的音视频之间的非同步,提出了一个基于动态贝叶斯网络的语音与唇动联合模型,并通过音视频双模态的多层次融合,实现了说话人识别系统鲁棒性的提高.音视频双模态数据库上的实验表明了,在不同语音信噪比的条件下多层次融合均达到了更好的性能.

著录项

来源
《电子学报》|2010年第12期|2920-2924|共5页
作者
陈雁翔; 刘鸣;
展开▼
作者单位

合肥工业大学计算机与信息学院,安徽,合肥,230009;

伊利诺伊大学香槟分校电子计算机工程系,伊利,诺伊州,61801;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
发音特征; 音视频; 说话人识别; 动态贝叶斯网络;
入库时间 2022-08-18 02:32:26

相似文献

中文文献
外文文献
专利

1. 基于发音特征的音视频融合语音识别模型 [J] . 吴鹏 ,蒋冬梅 ,王风娜 . 计算机工程 . 2011,第022期
2. 基于VEMAP的说话人识别鲁棒性研究 [J] . 黄文娜 ,彭亚雄 ,贺松 . 电声技术 . 2016,第011期
3. 基于PLDA的说话人识别时变鲁棒性问题研究 [J] . 陈霄鹏 ,彭亚雄 ,贺松 . 微型机与应用 . 2016,第005期
4. 基于压缩感知的鲁棒性说话人识别参数研究 [J] . 于云 ,周伟栋 . 计算机技术与发展 . 2016,第003期
5. 基于动态贝叶斯网络的音视频双模态说话人识别 [J] . 吴志勇 ,蔡莲红 . 计算机研究与发展 . 2006,第003期
6. 基于分数规整的发音方式鲁棒的说话人识别研究 [C] . 王琳琳 ,张利鹏 ,徐明星 . 第十届全国人机语音通讯学术会议 . 2009
7. 基于改进特征参数的说话人识别鲁棒性研究 [A] . 史小元 . 2017

基于发音特征的音视频说话人识别鲁棒性的研究

摘要

著录项

相似文献

相关主题

期刊订阅