首页> 中国专利> 基于噪声屏蔽核的说话人识别方法

基于噪声屏蔽核的说话人识别方法

摘要

本发明公开了语音信号处理领域的一种基于噪声屏蔽核的说话人识别方法。该方法包括:步骤1:输入音频数据,对音频数据逐帧提取短时特征;步骤2:采用语音数据的短时特征训练一个含M个高斯混元的GMM模型,记为语音GMM;步骤3:采用噪声数据的短时特征训练一个含N个高斯混元的GMM模型,记为噪声GMM;步骤4:将语音GMM和噪声GMM拼接成一个混合GMM;步骤5:用混合GMM生成噪声屏蔽超矢量;步骤6:采用生成的噪声屏蔽超矢量进行SVM的训练和测试,完成说话人的训练和识别。该方法可以对音频中含有的噪声进行自动屏蔽,且实现简单,可以有效提高噪声条件下说话人识别的性能。

著录项

  • 公开/公告号CN103714818B

    专利类型发明专利

  • 公开/公告日2016-06-22

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN201310681894.0

  • 发明设计人 张卫强;刘加;

    申请日2013-12-12

  • 分类号G10L17/20(20130101);

  • 代理机构11246 北京众合诚成知识产权代理有限公司;

  • 代理人黄家俊

  • 地址 100084 北京市海淀区北京市100084-82信箱

  • 入库时间 2022-08-23 09:41:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-19

    专利权的转移 IPC(主分类):G10L17/20 登记生效日:20200430 变更前: 变更后: 申请日:20131212

    专利申请权、专利权的转移

  • 2020-04-03

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G10L17/20 变更前: 变更后: 申请日:20131212

    专利权人的姓名或者名称、地址的变更

  • 2020-04-03

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G10L17/20 变更前: 变更后: 申请日:20131212

    专利权人的姓名或者名称、地址的变更

  • 2016-12-21

    专利权的转移 IPC(主分类):G10L17/20 登记生效日:20161201 变更前: 变更后: 申请日:20131212

    专利申请权、专利权的转移

  • 2016-12-21

    专利权的转移 IPC(主分类):G10L17/20 登记生效日:20161201 变更前: 变更后: 申请日:20131212

    专利申请权、专利权的转移

  • 2016-12-21

    专利权的转移 IPC(主分类):G10L 17/20 登记生效日:20161201 变更前: 变更后: 申请日:20131212

    专利申请权、专利权的转移

  • 2016-06-22

    授权

    授权

  • 2016-06-22

    授权

    授权

  • 2016-06-22

    授权

    授权

  • 2014-05-07

    实质审查的生效 IPC(主分类):G10L17/20 申请日:20131212

    实质审查的生效

  • 2014-05-07

    实质审查的生效 IPC(主分类):G10L17/20 申请日:20131212

    实质审查的生效

  • 2014-05-07

    实质审查的生效 IPC(主分类):G10L 17/20 申请日:20131212

    实质审查的生效

  • 2014-04-09

    公开

    公开

  • 2014-04-09

    公开

    公开

  • 2014-04-09

    公开

    公开

查看全部

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号