首页> 中国专利> 使用神经网络的说话人识别/定位

使用神经网络的说话人识别/定位

摘要

提供了利用联合说话人定位/说话人识别神经网络的计算设备和方法。在一个例子中,计算设备接收用户说出的话音的多通道音频信号。从该信号中提取幅度和相位信息特征,并将其输入到通过多人的话音进行训练的联合说话人定位/说话人识别神经网络中。从神经网络接收包括说话人识别特性和位置特性的用户嵌入,并将其与从多个话音中提取的多个注册嵌入进行比较,其中,每个话音与对应的人的身份相关联。至少基于这种比较,使用户与这些人之一的身份匹配,并输出该人的身份。

著录项

  • 公开/公告号CN112088403A

    专利类型发明专利

  • 公开/公告日2020-12-15

    原文格式PDF

  • 申请/专利权人 微软技术许可有限责任公司;

    申请/专利号CN201980030691.0

  • 发明设计人 张世雄;肖雄;

    申请日2019-04-30

  • 分类号G10L17/18(20060101);

  • 代理机构72002 永新专利商标代理有限公司;

  • 代理人赵腾飞

  • 地址 美国华盛顿州

  • 入库时间 2023-06-19 09:10:33

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号