首页> 中国专利> 基于卷积神经网络和频谱图的说话人识别方法

基于卷积神经网络和频谱图的说话人识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了基于卷积神经网络和频谱图的说话人识别方法，依次包括以下步骤：首先，采集每一位说话人音频信号；然后，将音频信号转换成频谱图；其次，将图片作为输入层，经过AlexNet训练这个神经网络；再次使用反向传播算法逐层调整神经网络各层的权值和偏置；最后得到神经网络参数，对说话人进行分类。该方法从卷积神经网络的处理方法来快速的识别说话人。

著录项

公开/公告号CN106952649A

专利类型发明专利
公开/公告日2017-07-14

原文格式PDF
申请/专利权人北京工业大学;
展开▼

申请/专利号CN201710336940.1
发明设计人李玉鑑;穆红章;
展开▼

申请日2017-05-14
分类号G10L17/18(20130101);G10L17/04(20130101);
代理机构11203 北京思海天达知识产权代理有限公司;
代理人沈波
地址 100124 北京市朝阳区平乐园100号
入库时间 2023-06-19 02:49:42

法律信息

法律状态公告日

法律状态信息

法律状态
2017-08-08

实质审查的生效 IPC(主分类):G10L17/18 申请日:20170514

实质审查的生效
2017-07-14

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于卷积神经网络和频谱图的说话人识别方法 [P] . 中国专利： CN106952649A . 2017-07-14
2. 基于语谱图统计特征的说话人识别方法 [P] . 中国专利： CN108831485B . 2021.04.23
3. GASTROINTESTINAL TUMOR MICROSCOPIC HYPER-SPECTRAL IMAGE PROCESSING METHOD BASED ON CONVOLUTIONAL NEURAL NETWORK [P] . 世界知识产权组织专利： WO2017215284A1 . 2017-12-21

机译：基于卷积神经网络的胃肠肿瘤显微超光谱图像处理方法
4. Speaker Identification Method Converged with Text Dependant Speaker Recognition and Text Independant Speaker Recognition in Artificial Intelligence Secretary Service and Voice Recognition Device Used Therein [P] . 韩国专利： KR101993827B1 . 2019-06-27

机译：融合了人工智能秘书服务中基于文本的说话人识别和基于文本的说话人识别的说话人识别方法及其中使用的语音识别装置
5. TRANSPOSE MEMORY UNIT FOR MULTI-BIT CONVOLUTIONAL NEURAL NETWORK BASED COMPUTING-IN-MEMORY APPLICATIONS, TRANSPOSE MEMORY ARRAY STRUCTURE FOR MULTI-BIT CONVOLUTIONAL NEURAL NETWORK BASED COMPUTING-IN-MEMORY APPLICATIONS AND COMPUTING METHOD THEREOF [P] . US2021216846A1 . 2021-07-15

机译：用于基于多位卷积神经网络的基于多位卷积神经网络的存储单元的存储单元，用于基于多位卷积神经网络的基于存储的内存应用的存储器阵列结构及其计算方法