首页> 中国专利> 基于说话人辅助信息的特定说话人语音提取方法及装置

基于说话人辅助信息的特定说话人语音提取方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本申请涉及人工智能技术，提供了基于说话人辅助信息的特定说话人语音提取方法、装置、设备及介质，先获取待识别音视频数据对应的分帧结果，然后获取所述分帧结果中各帧子音视频数据分别对应的子说话人活跃信息以组成说话人活跃信息，之后基于所述分帧结果中每一帧子音视频数据的对数频谱幅度系数生成对应帧子音视频数据的输入数据，最后将所述输入数据输入至所述说话人分类模型进行分类，所得到目标说话人识别特征再与每一帧子音视频数据的对数频谱幅度系数相乘，得到每一帧子音视频数据对应的目标说话人频谱。实现了在未输入目标说话人语音的前提下，即可从混杂语音中分离得到特定说话人的语音频谱，简化提取过程。

著录项

公开/公告号CN114999522A

专利类型发明专利
公开/公告日2022-09-02

原文格式PDF
申请/专利权人平安科技(深圳)有限公司;
展开▼

申请/专利号CN202210610122.7
发明设计人刘博卿;王健宗;张之勇;
展开▼

申请日2022-05-31
分类号G10L21/0272;G10L25/18;
代理机构深圳市精英专利事务所;
代理人丁宇龙
地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
入库时间 2023-06-19 16:39:50

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-02

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种基于时间潜在域特定说话人信息的目标语音提取方法 [P] . 中国专利： CN112562706A . 2021-03-26
2. 一种基于文本信息的辅助说话人分离方法及相关装置 [P] . 中国专利： CN111128223B . 2022-08-05
3. Speaker Identification Method Converged with Text Dependant Speaker Recognition and Text Independant Speaker Recognition in Artificial Intelligence Secretary Service and Voice Recognition Device Used Therein [P] . 韩国专利： KR101993827B1 . 2019-06-27

机译：融合了人工智能秘书服务中基于文本的说话人识别和基于文本的说话人识别的说话人识别方法及其中使用的语音识别装置
4. SPEAKER VERIFICATION APPARATUS AND METHOD UTILIZING VOICE INFORMATION OF A REGISTERED SPEAKER WITH EXTRACTED FEATURE PARAMETER AND CALCULATED VERIFICATION DISTANCE TO DETERMINE A MATCH OF AN INPUT VOICE WITH THAT OF A REGISTERED SPEAKER [P] . 美国专利： US6879968B1 . 2005-04-12

机译：说话人验证装置和方法，利用具有特征特征和计算的验证距离的注册说话人的语音信息来确定输入声音是否与注册说话人匹配
5. SPEAKER EMBEDDING EXTRACTION METHOD AND SYSTEM USING SPEECH RECOGNIZER-BASED POOLING TECHNIQUE FOR SPEAKER RECOGNITION, AND RECORDING MEDIUM FOR SAME [P] . 韩国专利： WO2022075714A1 . 2022-04-14

机译：使用基于语音识别器的池技术进行说话人识别的说话人嵌入提取方法和系统，以及用于该方法和系统的记录介质