首页> 中国专利> 一种基于字典学习和低秩矩阵分解的说话人识别方法

一种基于字典学习和低秩矩阵分解的说话人识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出了一种基于字典学习和低秩矩阵分解的说话人识别方法，包括以下步骤：步骤1，对说话人音频进行预加重、分帧、加窗、端点检测等处理；步骤2，提取出对应每个说话人语句的MFCC特征，并训练GMM‑UBM模型；步骤3，通过联合因子分析（JFA）估算全局差异空间矩阵T，全局差异空间因子w；步骤4，得到对应每个说话人语句的i‑vector；步骤5，从训练集中提取M维度的i‑vector并生成特征矩阵，根据训练集和测试集，对判别字典进行生成，得到的字典将作为i‑vector后端处理和打分模块，为最终判别提供依据；适应字典学习准则的编码系数可以有效提升识别力，并通过结构化稀疏来进行最优分类。

著录项

公开/公告号CN110265039A

专利类型发明专利
公开/公告日2019-09-20

原文格式PDF
申请/专利权人南京邮电大学;
展开▼

申请/专利号CN201910475010.3
发明设计人王昕;李宗晏;
展开▼

申请日2019-06-03
分类号G10L17/04(20130101);G10L17/02(20130101);G10L17/12(20130101);
代理机构32102 南京苏科专利代理有限责任公司;
代理人陈栋智
地址 210003 江苏省南京市鼓楼区新模范马路66号
入库时间 2024-02-19 14:39:51

法律信息

法律状态公告日

法律状态信息

法律状态
2019-10-22

实质审查的生效 IPC(主分类):G10L17/04 申请日:20190603

实质审查的生效
2019-09-20

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于字典学习和低秩矩阵分解的说话人识别方法 [P] . 中国专利： CN110265039B . 2021.07.02
2. 一种基于多成份低秩字典学习的医学图像融合方法 [P] . 中国专利： CN112819740A . 2021-05-18
3. METHOD AND SYSTEM FOR FACE RECOGNITION BY MEANS OF DICTIONARY LEARNING BASED ON KERNEL NON-NEGATIVE MATRIX FACTORIZATION, AND SPARSE FEATURE REPRESENTATION [P] . 世界知识产权组织专利： WO2018149133A1 . 2018-08-23

机译：基于核非负矩阵分解和稀疏特征表示的基于字典学习的人脸识别方法和系统
4. Low-Rank and Sparse Matrix Decomposition Based on Schatten p=1/2 and L1/2 Regularizations for Separation of Background and Dynamic Components for Dynamic MRI [P] . 美国专利： US2017169563A1 . 2017-06-15

机译：基于Schatten p = 1/2和L1 / 2正则化的低秩和稀疏矩阵分解以分离动态MRI的背景和动态分量
5. System and method for structured low-rank matrix factorization: optimality, algorithm, and applications to image processing [P] . 美国专利： US10235600B2 . 2019-03-19

机译：结构化低秩矩阵分解的系统和方法：最优性，算法及其在图像处理中的应用