Neural network; Speaker diarization; i-Vector;
机译:使用自联想神经网络进行说话人区分
机译:说话者差异化在非语音和非语音/语音混合视频音轨的音频索引中的适用性
机译:基于扬声器/风格嵌入的扬声器/型依赖神经网络语音合成
机译:电话言语扬声器简化中的神经网络扬声器描述符
机译:同频道语音中的说话人自动识别和区分
机译:使用LSTM神经从肉点发音运动中独立于说话者的沉默语音识别网络
机译:使用深度递归卷积神经网络的扬声器二值化 用于扬声器嵌入
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。