首页> 外国专利> KNOWLEDGE TRANSFER IN PERMUTATION INVARIANT TRAINING FOR SINGLE-CHANNEL MULTI-TALKER SPEECH RECOGNITION

KNOWLEDGE TRANSFER IN PERMUTATION INVARIANT TRAINING FOR SINGLE-CHANNEL MULTI-TALKER SPEECH RECOGNITION

机译：单通道多说话人语音识别的置换不变训练中的知识转移

页面导航

摘要
著录项
相似文献

摘要

Provided are a speech recognition training processing method and an apparatus including the same. The speech recognition training processing method includes acquiring a multi-talker mixed speech signal from a plurality of speakers, performing permutation invariant training (PIT) model training on the multi-talker mixed speech signal based on knowledge from a single-talker speech recognition model and updating a multi-talker speech recognition model based on a result of the PIT model training.

机译：提供了一种语音识别训练处理方法和包括该方法的设备。语音识别训练处理方法包括：从多个说话者获取多说话者混合语音信号;基于来自单说话者语音识别模型的知识，对多说话者混合语音信号进行置换不变训练（PIT）模型训练;以及根据PIT模型训练的结果，更新多讲话者语音识别模型。

著录项

公开/公告号US2019304437A1

专利类型
公开/公告日2019-10-03

原文格式PDF
申请/专利权人 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED;
展开▼

申请/专利号US201815940197
发明设计人 YANMIN QIAN;DONG YU;
展开▼

申请日2018-03-29
分类号G10L15/06;
国家 US
入库时间 2022-08-21 12:08:22

相似文献

专利
外文文献
中文文献