本文以语音产生的非线性模型为基础,研究了用于情感语音分类的语音信号能量谱包络下的面积(AUSEES, Area Under the Spectral Energy Envelope of the Speech Signal)和声门波形能量谱包络下的面积(AUSEEG, Area Under the Spectral Energy Envelope of the Glottal Waveform)两种谱能量特征。用模拟人耳听觉特性的Bark尺度频带划分方法对基本的 AUSEES、AUSEEG 特征中的线性平均划分方法进行了改进,生成了基于人耳听觉特性的谱能量AUSEES-Bark、 AUSEEG-Bark特征。将AUSEES-Bark、AUSEEG-Bark特征应用到情感语音识别中,试验的结果表明,改进后的特征识别率有了较大的提高,具有更好的情感分类效果。
展开▼