首页> 中国专利> 一种多人语音混合中目标说话人估计方法及系统

一种多人语音混合中目标说话人估计方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种多人语音混合中目标说话人估计方法及系统，其中方法包括使用麦克风阵列采集语音信号得到混合信号x，还包括以下步骤：使用FastICA算法进行多人混合语音分离，得到N个分离语音y；提取多个语音特征；进行语音特征归一化；归一化的语音特征加权融合；使用高斯混合模型进行加权参数优化；使用期望最大化算法EM算法进行高斯混合模型估计；输出目标语音。本发明提出的一种多人语音混合中目标说话人估计方法及系统，解决了多人场景下语音分离的不确定性问题和语音识别率低的问题，对多人混合语音中目标说话人进行概率估计，以便增强目标说话人语音的可懂度和识别率。

著录项

公开/公告号CN108766459B

专利类型发明专利
公开/公告日2020-07-17

原文格式PDF
申请/专利权人北京联合大学;
展开▼

申请/专利号CN201810610015.8
发明设计人刘宏哲;张启坤;
展开▼

申请日2018-06-13
分类号
代理机构北京驰纳智财知识产权代理事务所(普通合伙);
代理人谢亮
地址 100101 北京市朝阳区北四环东路97号
入库时间 2022-08-23 11:05:47

法律信息

法律状态公告日

法律状态信息

法律状态
2020-07-17

授权

授权
2018-12-11

实质审查的生效 IPC(主分类):G10L21/0272 申请日:20180613

实质审查的生效
2018-11-06

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种多人语音混合中目标说话人估计方法及系统 [P] . 中国专利： CN108766459B . 2020.07.17
2. 一种多人会话语音中的说话人重要程度估计方法 [P] . 中国专利： CN103400580A . 2013-11-20
3. METHOD FOR IDENTIFYING SPEAKER VOICE AND NON-VOICE NOISE IN BLIND SEPARATION, AND METHOD FOR SPECIFYING SPEAKER VOICE CHANNEL [P] . 日本专利： JP2002023776A . 2002-01-25

机译：盲分离中说话人语音和非语音噪声的识别方法及说话人语音通道的指定方法
4. SPEAKER IDENTIFICATION METHOD IN ARTIFICIAL INTELLIGENCE SECRETARIAL SERVICE IN WHICH CONTEXT-DEPENDENT SPEAKER IDENTIFICATION AND CONTEXT-INDEPENDENT SPEAKER IDENTIFICATION ARE CONVERGED, AND VOICE RECOGNITION DEVICE USED THEREFOR [P] . 世界知识产权组织专利： WO2019054680A1 . 2019-03-21

机译：融合了语境相关的说话人识别和语境独立的说话人识别的人工智慧秘书服务中的说话人识别方法，并使用语音识别设备
5. Speaker Identification Method Converged with Text Dependant Speaker Recognition and Text Independant Speaker Recognition in Artificial Intelligence Secretary Service and Voice Recognition Device Used Therein [P] . 韩国专利： KR101993827B1 . 2019-06-27

机译：融合了人工智能秘书服务中基于文本的说话人识别和基于文本的说话人识别的说话人识别方法及其中使用的语音识别装置