首页> 中国专利> 一种基于盲源分离的文本无关型多源说话人识别方法

一种基于盲源分离的文本无关型多源说话人识别方法

摘要

本发明提供一种基于盲源分离的文本无关型多源说话人识别方法,涉及声纹识别技术领域。该方法首先获取一段包含多个人的语音的声源,并采用盲源信号检测与分离算法对声源进行盲源分离和检测,将多源语音信号分离出多个单源语音信号;再对分离出的每个单源语音信号进行预加重、分帧及加窗处理,得到时序语音信号;并对时序语音信号进行小波包分解与重构;然后采用耳蜗听觉滤波器进行人耳特征滤波,提取语音特征;最后构建CNN模型,将提取的语音特征输入到CNN模型,实现多源说话人识别;本发明方法采用小波包和伽马通滤波器相结合的方法,可以在噪声环境下,拥有较高的识别率。

著录项

  • 公开/公告号CN112967722A

    专利类型发明专利

  • 公开/公告日2021-06-15

    原文格式PDF

  • 申请/专利权人 东北大学;赛尔网络有限公司;

    申请/专利号CN202110137229.X

  • 发明设计人 谭振华;徐晓梦;

    申请日2021-02-01

  • 分类号G10L17/00(20130101);G10L17/02(20130101);G10L17/18(20130101);G10L17/20(20130101);G10L21/0208(20130101);

  • 代理机构21109 沈阳东大知识产权代理有限公司;

  • 代理人李珉

  • 地址 110819 辽宁省沈阳市和平区文化路3号巷11号

  • 入库时间 2023-06-19 11:26:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-07-21

    发明专利申请公布后的驳回 IPC(主分类):G10L17/00 专利申请号:202110137229X 申请公布日:20210615

    发明专利申请公布后的驳回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号