机译:最大熵PLDA用于语音编码失真下的健壮说话人识别
Speech Communication and Signal Processing Laboratory Universite des Sciences et de la Technologie Houari Boumediene (USTHB) Algiers Algeria;
LARIHS Laboratory Campus Shappaing University of Moncton Moncton Canada;
GMM-UBM; MEGMM; i-vector/PLDA; i-vector/MEPLDA; Speaker identification; Speech coding;
机译:基于深度神经网络的语音识别和说话人自适应的插件最大后验解码器的分层贝叶斯组合
机译:在GSM RPE-LTP编码下实现鲁棒语音识别的失真类建模
机译:使用由MLLR转换生成的伪扬声器特征进行声学模型训练,以实现与扬声器无关的可靠语音识别
机译:在存在语音编码失真的情况下,强大的扬声器识别用于远程访问应用程序
机译:在语音编码失真存在下强大的扬声器识别
机译:识别消息和使者:仿生频谱分析可增强语音和说话者识别能力
机译:语音识别和语音编码的咬合约束,最大熵方法
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。