首页> 中国专利> 一种提升远场语音识别的前端处理方法和系统

一种提升远场语音识别的前端处理方法和系统

摘要

本申请提供了一种提升远场语音识别的前端处理方法和系统,其中所述方法包括:对房间冲激响应信号进行计算,得到早期混响信号与晚期混响信号的分割时间点,截取直达声信号和早期混响信号;将直达声信号和早期混响信号与语音库中干净语音信号在时域上进行卷积,得到时域目标信号;将时域目标信号和时域混合信号中除时域目标信号以外的其它信号分别进行计算,得到目标信号能量和其它信号能量,通过目标信号能量和其它信号能量得到理想比值掩蔽;将时域混合信号转换成频域混合信号后,将频域混合信号的幅值和理想比值掩蔽相乘,再使用频域混合信号的相位,得到重构信号。本发明通过理想幅值掩蔽从噪声混响条件下的混合语音中分离出目标信号。

著录项

  • 公开/公告号CN109523999B

    专利类型发明专利

  • 公开/公告日2021-03-23

    原文格式PDF

  • 申请/专利权人 中国科学院声学研究所;

    申请/专利号CN201811602419.9

  • 发明设计人 李军锋;高飞;颜永红;

    申请日2018-12-26

  • 分类号G10L15/22(20060101);G10L21/0208(20130101);G10L21/0272(20130101);

  • 代理机构11309 北京亿腾知识产权代理事务所(普通合伙);

  • 代理人陈霁

  • 地址 100190 北京市海淀区北四环西路21号

  • 入库时间 2022-08-23 11:36:30

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号