Class Confusability Reduction in Audio-Visual Speech Recognition Using Random Forests

机译：使用随机森林的视听语音识别中的类混淆性降低

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper presents an audio-visual speech classification system based on Random Forests classifiers, aiming to reduce the intra-class misclassification problems, which is a very usual situation, specially in speech recognition tasks. A novel training procedure is proposed, introducing the concept of Complementary Random Forests (CRF) classifiers. Experimental results over three audio-visual databases, show that a good performance is achieved with the proposed system for the different types of input information considered, viz., audio-only information, video-only information and fused audio-video information. In addition, these results also indicate that the proposed method performs satisfactorily over the three databases using the same configuration parameters.

机译：本文提出了一种基于随机森林分类器的视听语音分类系统，旨在减少类内误分类问题，这是一种很常见的情况，特别是在语音识别任务中。提出了一种新颖的训练程序，引入了互补随机森林（CRF）分类器的概念。在三个视听数据库上的实验结果表明，对于所考虑的不同类型的输入信息（即纯音频信息，纯视频信息和融合的音频视频信息），该系统可实现良好的性能。此外，这些结果还表明，使用相同的配置参数，该方法在三个数据库上的性能令人满意。

著录项

来源
《Iberoamerican congress on pattern recognition》|2018年|584-592|共9页
会议地点
作者
Gonzalo D. Sad; Lucas D. Terissi; Juan C. Gomez;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Speech recognition; Audio-visual speech; Random forests;

机译：语音识别;视听语音;随机森林;

相似文献

外文文献
中文文献
专利

1. Noise robust speech recognition system using multimodal audio-visual approach using different deep learning classification techniques [J] . Eslam E. El Maghraby, Amr M. Gody, Mohamed Hesham Farouk International Journal of Advanced Computer Research . 2020,第47期

机译：利用不同深度学习分类技术，使用多模式视听方法的噪声强大语音识别系统
2. A Novel Algorithm for Acoustic and Visual Classifiers Decision Fusion in Audio-Visual Speech Recognition System [J] . P.S. Sathidevi, Rajavel Signal Processing: An International Journal . 2010,第1期

机译：视听语音识别系统中声，视觉分类器决策融合的新算法
3. Speech emotion recognition using hybrid spectral-prosodic features of speech signal/glottal waveform, metaheuristic-based dimensionality reduction, and Gaussian elliptical basis function network classifier [J] . Daneshfar Fatemeh, Kabudian Seyed Jahanshah, Neekabadi Abbas Applied Acoustics . 2020,第Sepa期

机译：语音情感识别使用语音信号/光学波形的混合谱 - 韵律特征，基于血管训练的维数减少和高斯椭圆形基函数网络分类器
4. Class Confusability Reduction in Audio-Visual Speech Recognition Using Random Forests [C] . Gonzalo D. Sad, Lucas D. Terissi, Juan C. Gomez Iberoamerican Congress on Pattern Recognition . 2018

机译：使用随机森林的视听语音识别的阶级可混淆降低
5. Robust speech processing based on microphone array, audio-visual, and frame selection for in-vehicle speech recognition and in-set speaker recognition. [D] . Zhang, Xianxian. 2005

机译：基于麦克风阵列，视听和帧选择的强大语音处理功能，可实现车载语音识别和内置说话人识别。
6. An Activity Recognition Framework Deploying the Random Forest Classifier and A Single Optical Heart Rate Monitoring and Triaxial Accelerometer Wrist-Band † [O] . Saeed Mehrang, Julia Pietilä, Ilkka Korhonen 2018

机译：部署随机森林分类器和单光学心率监测和三轴加速度计腕带的活动识别框架†
7. Class-specific classifiers in Audio-Visual Speech Recognition [O] . Baggenstoss Paul, Estellers Virginia, Thiran Jean-Philippe 2010

机译：视听语音识别中的类特定分类器

Class Confusability Reduction in Audio-Visual Speech Recognition Using Random Forests

摘要

著录项

相似文献

相关主题

期刊订阅