首页> 中国专利> 基于深度自编码网络的说话人性别自动识别方法及系统

基于深度自编码网络的说话人性别自动识别方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明属于声纹识别技术领域，公开了一种基于深度自编码网络的说话人性别自动识别方法及系统，利用与注册说话人及信道均无关的语音信号训练UBM通用背景模型；提取注册数据的i‑vector；提取测试数据的i‑vector；训练深度自编码网络；模式匹配与识别，并进行模型评估。本发明将深度自编码网络应用于说话人性别识别中，将深度自编码网络强大的学习能力用于表征不同性别的说话人特征，不仅实现了特征的再提取，同时降低了特征维数，从而降低了分类运算时的复杂度。本发明提出的方法可进一步推广应用于说话人识别，尝试提高说话人识别系统的鲁棒性。

著录项

公开/公告号CN109545227A

专利类型发明专利
公开/公告日2019-03-29

原文格式PDF
申请/专利权人华中师范大学;
展开▼

申请/专利号CN201810402685.0
发明设计人王志锋;段苏容;左明章;田元;闵秋莎;夏丹;叶俊民;陈迪;罗恒;姚璜;
展开▼

申请日2018-04-28
分类号G10L17/02(20130101);G10L17/04(20130101);G10L17/18(20130101);G10L25/24(20130101);
代理机构11401 北京金智普华知识产权代理有限公司;
代理人杨采良
地址 430079 湖北省武汉市洪山区珞喻路152号
入库时间 2024-02-19 09:17:57

法律信息

法律状态公告日

法律状态信息

法律状态
2019-04-23

实质审查的生效 IPC(主分类):G10L17/02 申请日:20180428

实质审查的生效
2019-03-29

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于深度自编码网络的说话人性别自动识别方法及系统 [P] . 中国专利： CN109545227A . 2019-03-29
2. 一种基于自动编码深度置信网络的高质量说话人识别方法 [P] . 中国专利： CN107039036A . 2017-08-11
3. Method for automatic speaker recognition with hurst parameter based features and method for speaker classification based on fractional brownian motion classifiers [P] . 美国专利： US7904295B2 . 2011-03-08

机译：基于hurst参数特征的说话人自动识别方法和基于分数布朗运动分类器的说话人分类方法
4. DEEP RESIDUAL NETWORK-BASED GENDER RECOGNITION METHOD AND APPARATUS, MEDIUM, AND DEVICE [P] . 世界知识产权组织专利： WO2020151300A1 . 2020-07-30

机译：基于深度残差网络的性别识别方法及装置，介质和装置
5. A speaker identification method based on deep learning [P] . AU2020102038A4 . 2020-10-08

机译：基于深度学习的说话人识别方法