首页> 中国专利> 具有未知数量的多个说话者的话音分离

具有未知数量的多个说话者的话音分离

摘要

在一个实施例中,一种方法包括:接收混合音频信号,该混合音频信号包括与多个说话者相关联的话音信号的混合;通过使用配置有第一数量的输出通道的第一机器学习模型处理混合音频信号来生成第一音频信号;基于第一音频信号来确定第一数量的输出通道中的至少一个输出通道是无声的;通过使用配置有第二数量的输出通道的第二机器学习模型处理混合音频信号来生成第二音频信号,第二数量的输出通道比第一数量的输出通道少;基于第二音频信号来确定第二数量的输出通道中的每个输出通道是非无声的;并且使用第二机器学习模型来分离与多个说话者相关联的附加混合音频信号。

著录项

  • 公开/公告号CN115104153A

    专利类型发明专利

  • 公开/公告日2022-09-23

    原文格式PDF

  • 申请/专利权人 元平台公司;

    申请/专利号CN202080096429.9

  • 发明设计人 L·沃尔夫;Y·M·阿迪;E·纳克玛尼;

    申请日2020-12-14

  • 分类号G10L21/0272;G10L25/30;G10L25/78;

  • 代理机构北京市金杜律师事务所;

  • 代理人丁君军

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 16:54:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-23

    公开

    国际专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号