机译:SpeakerBeam:用于语音混合中目标说话人提取的说话人感知神经网络
Brno Univ Technol Speech FIT Brno 60190 Czech Republic;
NTT Corp NTT Commun Sci Labs Kyoto 6190237 Japan;
Speaker extraction; speaker-aware neural network; multi-speaker speech recognition;
机译:SpeakerBeam:一种新的深度学习技术,用于根据说话者的语音特征提取目标说话者的语音
机译:TEnet:目标说话人提取网络,具有累积的说话人嵌入功能,可自动识别语音
机译:基于扬声器/风格嵌入的扬声器/型依赖神经网络语音合成
机译:时域扬声器束改善目标语音提取的扬声器辨别力
机译:用于与说话人无关的语音识别的卷积神经网络。
机译:使用LSTM神经从肉点发音运动中独立于说话者的沉默语音识别网络
机译:使用神经扬声器嵌入的扬声器感知注意力的关注结束语音识别