Adaptive Reliability Measure and Optimum Integration Weight for Decision Fusion Audio-visual Speech Recognition

R. Rajavel; P. S. Sathidevi

首页> 外文期刊>Journal of signal processing systems for signal, image, and video technology >Adaptive Reliability Measure and Optimum Integration Weight for Decision Fusion Audio-visual Speech Recognition

【24h】

Adaptive Reliability Measure and Optimum Integration Weight for Decision Fusion Audio-visual Speech Recognition

机译：决策融合视听语音识别的自适应可靠性度量和最佳集成权

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Audio-visual speech recognition (AVSR) using acoustic and visual signals of speech has received attention recently because of its robustness in noisy environments. An important issue in decision fusion based AVSR system is the determination of appropriate integration weight for the speech modalities to integrate and ensure better performance under various SNR conditions. Generally, the integration weight is calculated from the relative reliability of two modalities. This paper investigates the effect of reliability measure on integration weight estimation and proposes a genetic algorithm (GA) based reliability measure which uses optimum number of best recognition hypotheses rather than N best recognition hypotheses to determine an appropriate integration weight. Further improvement in recognition accuracy is achieved by optimizing the above measured integration weight by genetic algorithm. The performance of the proposed integration weight estimation scheme is demonstrated for isolated word recognition (incorporating commonly used functions in mobile phones) via multi-speaker database experiment. The results show that the proposed schemes improve robust recognition accuracy over the conventional unimodal systems, and a couple of related existing bimodal systems, namely, the baseline reliability ratio-based system and N best recognition hypotheses reliability ratio-based system under various SNR conditions.

机译：最近，由于其在嘈杂环境中的鲁棒性，使用语音的声音和视觉信号的视听语音识别（AVSR）受到了关注。基于决策融合的AVSR系统中的一个重要问题是确定语音模态的适当集成权重，以在各种SNR条件下进行集成并确保更好的性能。通常，积分权重是根据两种模态的相对可靠性计算得出的。本文研究了可靠性测度对积分权重估计的影响，并提出了一种基于遗传算法（GA）的可靠性测度，该方法使用最佳数量的最佳识别假设而不是N个最佳识别假设来确定合适的积分权重。通过遗传算法优化上述测得的积分权重，可以进一步提高识别精度。通过多说话者数据库实验，证明了所提出的积分权重估计方案的性能，用于孤立单词识别（结合了手机中常用的功能）。结果表明，所提出的方案与常规的单峰系统相比，在各种信噪比条件下，已有几种相关的双峰系统，即基于基线可靠性比的系统和基于N最佳识别假设的基于可靠性比的系统，提高了鲁棒的识别精度。

著录项

来源
《Journal of signal processing systems for signal, image, and video technology》 |2012年第1期|p.83-93|共11页
作者
R. Rajavel; P. S. Sathidevi;
展开▼
作者单位

ECE Department, National Institute of Technology Calicut,Calicut 673601, India;

ECE Department, National Institute of Technology Calicut,Calicut 673601, India;

展开▼
收录信息美国《科学引文索引》(SCI);美国《工程索引》(EI);
原文格式 PDF
正文语种 eng
中图分类
关键词
audio-visual speech recognition; side face visual feature extraction; audio-visual decision fusion; reliability-ratio based weight optimization; GA based reliability measure;

机译：视听语音识别;侧面视觉特征提取;视听决策融合;基于可靠性比率的权重优化;基于GA的可靠性衡量;

相似文献

外文文献
中文文献
专利

1. A new GA optimised Reliability Ratio based integration weight estimation scheme for decision fusion Audio-Visual Speech Recognition [J] . R. Rajavel, P. S. Sathidevi International Journal of Signal and Imaging Systems Engineering . 2011,第2期

机译：一种新的基于遗传算法优化的基于可靠性比率的集成权重估计方案，用于决策融合视听语音识别
2. Optimum integration weight for decision fusion audio-visual speech recognition [J] . R. Rajavel, P. S. Sathidevi International Journal of Computational Science and Engineering . 2015,第1a2期

机译：决策融合视听语音识别的最佳集成权重
3. The Effect of Reliability Measure on Integration Weight Estimation in Audio-Visual Speech Recognition [J] . R. RAJAVEL, Dr. P. S. SATHIDEVI International Journal of Engineering Science and Technology . 2010,第8期

机译：可靠性措施对视听语音识别中集成权重估计的影响
4. Sensor fusion weighting measures in Audio-Visual Speech Recognition [C] . Trent W. Lewis, David M. W. Powers Australasian conference on Computer science . 2004

机译：视听语音识别中的传感器融合加权度量
5. A multimodal sensor fusion architecture for audio-visual speech recognition. [D] . Makkook, Mustapha A. 2007

机译：用于视听语音识别的多模式传感器融合体系结构。
6. Optimality and Limitations of Audio-Visual Integration for Cognitive Systems [O] . William Paul Boyce, Anthony Lindsay, Arkady Zgonnikov, 2020

机译：认知系统视听集成的最优性与限制
7. Improved speech recognition using adaptive audio-visual fusion via a stochastic secondary classifier [O] . Simon Lucey, Sridha Sridharan, Vinod Ch 2016

机译：通过随机二级分类器使用自适应视听融合改进语音识别

Adaptive Reliability Measure and Optimum Integration Weight for Decision Fusion Audio-visual Speech Recognition

摘要

著录项

相似文献

相关主题

期刊订阅