首页> 中国专利> 用于语音分离、识别的短时傅里叶变化的优化方法及系统

用于语音分离、识别的短时傅里叶变化的优化方法及系统

摘要

本发明实施例提供一种用于语音分离的短时傅里叶变化的优化方法。该方法包括:通过设定窗长上限的窗函数控制短时傅里叶变换的滑动窗口长度,使滑动窗口长度连续可变;利用短时傅里叶变换的滑动窗口长度对混合噪声训练语音进行处理,得到音频幅度谱;将音频幅度谱输入至语音分离模型进行有监督训练,根据有监督训练的收敛结果从长度连续可变的滑动窗口中确定备选窗口长度。本发明实施例还提供一种用于语音分离的短时傅里叶变化的优化系统。本发明实施例通过控制窗内参数将不能训练离散窗长转换为连续的量,这样即可实现训练窗长的目的。可以通过训练得到适合该数据集的最优窗长,进而提升语音分离和识别的效果。

著录项

  • 公开/公告号CN113611292A

    专利类型发明专利

  • 公开/公告日2021-11-05

    原文格式PDF

  • 申请/专利权人 思必驰科技股份有限公司;

    申请/专利号CN202110902505.7

  • 发明设计人 钱彦旻;曲博文;李晨达;

    申请日2021-08-06

  • 分类号G10L15/06(20130101);G10L15/20(20060101);

  • 代理机构11400 北京商专永信知识产权代理事务所(普通合伙);

  • 代理人黄谦;车江华

  • 地址 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋

  • 入库时间 2023-06-19 13:09:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号