首页> 中国专利> 具有未知数量的多个说话者的话音分离

具有未知数量的多个说话者的话音分离

页面导航

摘要
著录项
法律信息
相似文献

摘要

在一个实施例中，一种方法包括：接收混合音频信号，该混合音频信号包括与多个说话者相关联的话音信号的混合；通过使用配置有第一数量的输出通道的第一机器学习模型处理混合音频信号来生成第一音频信号；基于第一音频信号来确定第一数量的输出通道中的至少一个输出通道是无声的；通过使用配置有第二数量的输出通道的第二机器学习模型处理混合音频信号来生成第二音频信号，第二数量的输出通道比第一数量的输出通道少；基于第二音频信号来确定第二数量的输出通道中的每个输出通道是非无声的；并且使用第二机器学习模型来分离与多个说话者相关联的附加混合音频信号。

著录项

公开/公告号CN115104153A

专利类型发明专利
公开/公告日2022-09-23

原文格式PDF
申请/专利权人元平台公司;
展开▼

申请/专利号CN202080096429.9
发明设计人 L·沃尔夫;Y·M·阿迪;E·纳克玛尼;
展开▼

申请日2020-12-14
分类号G10L21/0272;G10L25/30;G10L25/78;
代理机构北京市金杜律师事务所;
代理人丁君军
地址美国加利福尼亚州
入库时间 2023-06-19 16:54:51

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-23

公开

国际专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种说话人数未知的多通道语音分离方法 [P] . 中国专利： CN112116920B . 2022-08-05
2. 一种说话人数未知的多通道语音分离方法 [P] . 中国专利： CN112116920A . 2020-12-22
3. Method of speaker clustering for unknown speakers in conversational audio data [P] . 美国专利： US5598507A . 1997-01-28

机译：对话音频数据中未知说话人的说话人聚类方法
4. Voice Separation with An Unknown Number of Multiple Speakers [P] . 美国专利： US2021256993A1 . 2021-08-19

机译：语音分离，包含未知数量的多个扬声器
5. VOICE SEPARATION WITH AN UNKNOWN NUMBER OF MULTIPLE SPEAKERS [P] . 美国专利： WO2021167683A1 . 2021-08-26

机译：语音分离，包含未知数量的多个扬声器