首页> 中国专利> 一种基于自动编码深度置信网络的高质量说话人识别方法

一种基于自动编码深度置信网络的高质量说话人识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于自动编码深度置信网络的高质量说话人识别方法，包括模型训练和说话人识别：首先对说话人语音进行预处理，提取MFCC特征参数，为不同说话人特征参数进行标记。将多名说话人特征参数输入深度置信网络进行网络训练学习，得到自动编码深度置信网络。利用训练好的自动编码深度置信网络分别对每个说话人提取的特征参数进行编码重构，输出数据作为矢量量化模型的输入，进行矢量量化模型训练。说话人识别阶段，说话人的语音特征参数经自动编码深度置信网络编码重构，输入矢量量化模型进行识别。通过深度置信网络对说话人语音特征的编码重构，提取说话人个性特征的同时，可以过滤语音中的噪声，提高了说话人识别准确性和系统鲁棒性。

著录项

公开/公告号CN107039036B

专利类型发明专利
公开/公告日2020-06-16

原文格式PDF
申请/专利权人南京邮电大学;
展开▼

申请/专利号CN201710088300.3
发明设计人李燕萍;刘俊坤;凌云志;
展开▼

申请日2017-02-17
分类号
代理机构江苏海越律师事务所;
代理人唐小红
地址 210003 江苏省南京市新模范马路66号
入库时间 2022-08-23 11:01:44

法律信息

法律状态公告日

法律状态信息

法律状态
2020-06-16

授权

授权
2017-09-05

实质审查的生效 IPC(主分类):G10L15/06 申请日:20170217

实质审查的生效
2017-08-11

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于自动编码深度置信网络的高质量说话人识别方法 [P] . 中国专利： CN107039036B . 2020.06.16
2. 一种基于自动编码深度置信网络的高质量说话人识别方法 [P] . 中国专利： CN107039036A . 2017-08-11
3. Speaker Identification Method Converged with Text Dependant Speaker Recognition and Text Independant Speaker Recognition in Artificial Intelligence Secretary Service and Voice Recognition Device Used Therein [P] . 韩国专利： KR101993827B1 . 2019-06-27

机译：融合了人工智能秘书服务中基于文本的说话人识别和基于文本的说话人识别的说话人识别方法及其中使用的语音识别装置
4. System of product defect discrimination using an unsupervised learning based regional convolutional auto-encoder and Method of product defect discrimination using an unsupervised learning based regional convolutional auto-encoder [P] . 韩国专利： KR101911061B1 . 2018-10-23

机译：使用基于无监督学习的区域卷积自动编码器的产品缺陷判别系统和使用基于无监督学习的区域卷积自动编码器的产品缺陷判别方法
5. A process for the production of high quality medium oils and distillates from a hydrocarbon charge in which at least 20 by volume boils above 340 ° C and a plant for the production of high quality oils and, where appropriate, distillates high quality media. [P] . BR9915120B1 . 2010-12-14

机译：一种由至少20％（体积）在340°C以上沸腾的烃类进料生产高质量中油和馏出物的方法，以及一种生产高质量油的工厂，并在适当情况下蒸馏出高质量的介质。