首页> 中国专利> 基于复合声学特征和低秩分解TDNN的说话人识别系统及方法

基于复合声学特征和低秩分解TDNN的说话人识别系统及方法

摘要

基于复合声学特征和低秩分解TDNN的说话人识别系统及方法。对输入的语音信号在预处理后采用MFCC和归一化互相关函数进行声学特征提取,将两种特征复合;在说话人模块中,将复合声学特征输入低秩矩阵分解TDNN进行帧级别特征提取,再经过统计池化层后,通过两个全连接层和一个softmax层完成段级别特征提取,并得到输入语音对应的特征向量。上述方法在采用低秩矩阵分解对TDNN进行优化,能够显著减小参数规模,加快训练速度;同时在网络中采用跳层连接,以减少梯度消失的出现;相较于常规声学特征提取在MFCC特征的基础上增加了归一化互相关函数进行音高特征提取,弥补了单纯采用MFCC对高频信息的损失,增加了特征的多样性,提高说话人识别的准确性。

著录项

  • 公开/公告号CN112331216A

    专利类型发明专利

  • 公开/公告日2021-02-05

    原文格式PDF

  • 申请/专利权人 同济大学;

    申请/专利号CN202011183292.9

  • 发明设计人 苗冉;王以;申树藩;卫志华;

    申请日2020-10-29

  • 分类号G10L17/00(20130101);G10L17/02(20130101);G10L17/04(20130101);G10L17/06(20130101);G10L17/18(20130101);G10L25/24(20130101);

  • 代理机构31290 上海科律专利代理事务所(特殊普通合伙);

  • 代理人叶凤

  • 地址 200092 上海市杨浦区四平路1239号

  • 入库时间 2023-06-19 09:49:27

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-10

    发明专利申请公布后的视为撤回 IPC(主分类):G10L17/00 专利申请号:2020111832929 申请公布日:20210205

    发明专利申请公布后的视为撤回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号