首页> 中国专利> 基于说话人辅助信息的特定说话人语音提取方法及装置

基于说话人辅助信息的特定说话人语音提取方法及装置

摘要

本申请涉及人工智能技术,提供了基于说话人辅助信息的特定说话人语音提取方法、装置、设备及介质,先获取待识别音视频数据对应的分帧结果,然后获取所述分帧结果中各帧子音视频数据分别对应的子说话人活跃信息以组成说话人活跃信息,之后基于所述分帧结果中每一帧子音视频数据的对数频谱幅度系数生成对应帧子音视频数据的输入数据,最后将所述输入数据输入至所述说话人分类模型进行分类,所得到目标说话人识别特征再与每一帧子音视频数据的对数频谱幅度系数相乘,得到每一帧子音视频数据对应的目标说话人频谱。实现了在未输入目标说话人语音的前提下,即可从混杂语音中分离得到特定说话人的语音频谱,简化提取过程。

著录项

  • 公开/公告号CN114999522A

    专利类型发明专利

  • 公开/公告日2022-09-02

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN202210610122.7

  • 发明设计人 刘博卿;王健宗;张之勇;

    申请日2022-05-31

  • 分类号G10L21/0272;G10L25/18;

  • 代理机构深圳市精英专利事务所;

  • 代理人丁宇龙

  • 地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

  • 入库时间 2023-06-19 16:39:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-02

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号