【24h】

Auditory Features with Vocal Track Length Normalization for Language Identification

机译:语音轨迹长度归一化的听觉功能用于语言识别

获取原文

摘要

This paper reports on a novel feature, auditory cepstrum coefficient (ACC) with vocal tract length normalization (VTLN), for language identification (LID). The ACC feature is based on the auditory characteristics of human ear and the VTLN technology compensates the speaker variability. The detailed implementation of ACC feature with VTLN in frequency domain is given. Experimental results show that the proposed auditory feature outperforms its widely used Mel-frequency cepstrum coefficient (MFCC) counterpart and is more effective when combined with VTLN.
机译:本文报告了一种具有语音长度标准化(VTLN)的听觉倒频谱系数(ACC),用于语言识别(LID)。 ACC功能基于人耳的听觉特征,而VTLN技术可补偿说话人的变异性。给出了在频域中使用VTLN实现ACC功能的详细信息。实验结果表明,所提出的听觉特征优于其广泛使用的梅尔频率倒谱系数(MFCC),并且与VTLN结合使用时更加有效。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号