首页> 外文会议>2012 IEEE Workshop on Signal Processing Systems. >Speech/Audio Signal Classification Using Spectral Flux Pattern Recognition
【24h】

Speech/Audio Signal Classification Using Spectral Flux Pattern Recognition

机译:使用频谱通量模式识别的语音/音频信号分类

获取原文
获取原文并翻译 | 示例

摘要

In this paper, we present a novel method for the improvement of speech and audio signal classification using spectral flux (SF) pattern recognition for the MPEG Unified Speech and Audio Coding (USAC) standard. For effective pattern recognition, the Gaussian mixture model (GMM)probability model is used. For the optimal GMM parameter extraction, we use the expectation maximization (EM)algorithm. The proposed classification algorithm is divided into two significant parts. The first one extracts the optimal parameters for the GMM. The second distinguishes between speech and audio signals using SF pattern recognition. The performance of the proposed classification algorithm shows better results compared to the conventionally implemented USAC scheme.
机译:在本文中,我们为MPEG统一语音和音频编码(USAC)标准提供了一种使用频谱通量(SF)模式识别的语音和音频信号分类改进方法。为了进行有效的模式识别,使用了高斯混合模型(GMM)概率模型。对于最佳GMM参数提取,我们使用期望最大化(EM)算法。提出的分类算法分为两个重要部分。第一个为GMM提取最佳参数。第二种使用SF模式识别来区分语音和音频信号。与常规实现的USAC方案相比,所提出的分类算法的性能显示出更好的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号