首页> 中国专利> 一种基于盲源分离的文本无关型多源说话人识别方法

一种基于盲源分离的文本无关型多源说话人识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种基于盲源分离的文本无关型多源说话人识别方法，涉及声纹识别技术领域。该方法首先获取一段包含多个人的语音的声源，并采用盲源信号检测与分离算法对声源进行盲源分离和检测，将多源语音信号分离出多个单源语音信号；再对分离出的每个单源语音信号进行预加重、分帧及加窗处理，得到时序语音信号；并对时序语音信号进行小波包分解与重构；然后采用耳蜗听觉滤波器进行人耳特征滤波，提取语音特征；最后构建CNN模型，将提取的语音特征输入到CNN模型，实现多源说话人识别；本发明方法采用小波包和伽马通滤波器相结合的方法，可以在噪声环境下，拥有较高的识别率。

著录项

公开/公告号CN112967722A

专利类型发明专利
公开/公告日2021-06-15

原文格式PDF
申请/专利权人东北大学;赛尔网络有限公司;
展开▼

申请/专利号CN202110137229.X
发明设计人谭振华;徐晓梦;
展开▼

申请日2021-02-01
分类号G10L17/00(20130101);G10L17/02(20130101);G10L17/18(20130101);G10L17/20(20130101);G10L21/0208(20130101);
代理机构21109 沈阳东大知识产权代理有限公司;
代理人李珉
地址 110819 辽宁省沈阳市和平区文化路3号巷11号
入库时间 2023-06-19 11:26:00

法律信息

法律状态公告日

法律状态信息

法律状态
2023-07-21

发明专利申请公布后的驳回 IPC(主分类):G10L17/00 专利申请号:202110137229X 申请公布日:20210615

发明专利申请公布后的驳回

相似文献

专利
中文文献
外文文献

1. 一种基于盲源分离的文本无关型多源说话人识别方法 [P] . 中国专利： CN112967722A . 2021-06-15
2. 基于深度学习的文本无关多标号说话人识别方法 [P] . 中国专利： CN111667836A . 2020-09-15
3. Text-independent speaker recognition system and method based on acoustic segment matching [P] . 美国专利： US4773093A . 1988-09-20

机译：基于声学片段匹配的文本无关说话人识别系统和方法
4. The system and method based on computer for the development of monolingual documents systems based computer to translate text input in language source for a foreign language and to desInvolvement of documents mono and multilingual translation method based on the computer to translate the text in the language source for a language estrageira method based on computer for developmentThe documents mono and multilingual translation and domain model tripartite [P] . BR9307175A . 1999-03-30

机译：用于开发单语文档的基于计算机的系统和方法基于计算机的系统，用于翻译外语源中的文本输入，并且基于计算机的单，多语翻译方法涉及用于翻译语言源中的文本的计算机。一种基于计算机的语言开发方法用于文档开发单，多语言翻译和领域模型三方
5. BLIND SOURCE SEPARATION METHOD AND SYSTEM BASED ON SEPARATION MATRIX INITIALIZATION FREQUENCY POINT SELECTION [P] . WO2021179416A1 . 2021-09-16

机译：基于分离矩阵初始化频率点选择的盲源分离方法和系统