首页> 中国专利> 分离说话人音频的方法及装置

分离说话人音频的方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开一种分离说话人音频的方法及装置。在该方法中，音频采集设备获取音频数据集；确定所述音频数据集中各个音频数据所对应的声源角度；根据所述音频数据的声源角度，从所述音频数据集中筛选对应声源角度在第一设定角度范围内的第一音频数据子集和对应声源角度在第二设定角度范围内的第二音频数据子集，其中所述第一音频数据子集和所述第二音频子集分别用于确定对应第一说话人和第二说话人的音频数据。由此，在前端区分不同说话人的音频数据，无需后台设备进行特征相似度比对处理，可以降低后台设备的处理压力，能够在大范围业务场景下适用。

著录项

公开/公告号CN112382306A

专利类型发明专利
公开/公告日2021-02-19

原文格式PDF
申请/专利权人苏州思必驰信息科技有限公司;
展开▼

申请/专利号CN202011401496.5
发明设计人邹兴旺;周强;
展开▼

申请日2020-12-02
分类号G10L21/028(20130101);
代理机构11400 北京商专永信知识产权代理事务所(普通合伙);
代理人黄谦;车江华
地址 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
入库时间 2023-06-19 09:57:26

法律信息

法律状态公告日

法律状态信息

法律状态
2022-05-10

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 分离说话人音频的方法及装置 [P] . 中国专利： CN112382306A . 2021-02-19
2. 说话人分离模型训练方法、两说话人分离方法及相关设备 [P] . 中国专利： CN108766440A . 2018-11-06
3. Way of sound separation composite audio data, speaker identification method, voice separation apparatus of complex audio data, speaker specific equipment, computer program, and recording medium [P] . 日本专利： JP3364487B2 . 2003-01-08

机译：声音分离复合音频数据的方式，说话者识别方法，复杂音频数据的声音分离装置，说话者专用设备，计算机程序和记录介质
4. Speaker selecting arrangement and speaker adaptation model compilation device, speaker selective method, program and speaker adaptation model compilation program for speaker selection [P] . 日本专利： JPWO2008117626A1 . 2010-07-15

机译：说话人选择装置和说话人适应模型编辑装置，说话人选择方法，用于说话人选择的程序和说话人适应模型编辑程序
5. Speaker selecting arrangement and speaker adaptation model compilation device, speaker selective method and program for speaker selection [P] . 日本专利： JPWO2009057739A1 . 2011-03-10

机译：说话人选择装置和说话人适应模型编辑装置，说话人选择方法和说话人选择程序