首页> 中文会议>第十一届全国人机语音通讯学术会议 >基于人耳听觉特性的谱能量特征在情感语音识别中的研究

基于人耳听觉特性的谱能量特征在情感语音识别中的研究

摘要

本文以语音产生的非线性模型为基础,研究了用于情感语音分类的语音信号能量谱包络下的面积(AUSEES, Area Under the Spectral Energy Envelope of the Speech Signal)和声门波形能量谱包络下的面积(AUSEEG, Area Under the Spectral Energy Envelope of the Glottal Waveform)两种谱能量特征。用模拟人耳听觉特性的Bark尺度频带划分方法对基本的 AUSEES、AUSEEG 特征中的线性平均划分方法进行了改进,生成了基于人耳听觉特性的谱能量AUSEES-Bark、 AUSEEG-Bark特征。将AUSEES-Bark、AUSEEG-Bark特征应用到情感语音识别中,试验的结果表明,改进后的特征识别率有了较大的提高,具有更好的情感分类效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号