摘要:现有的计算机辅助语言学习系统(Computer Assisted Language Learning,CALL)在得到GOP分数之后,对所有的音素都使用相同的映射函数计算相应的句子得分,忽略了不同音素发音之间的差异性。本文提出了一种使用专家评分语音对GOP分数归一化处理的新方法“概率分布映射算法” (probability distribution mapping algorithm,PDMA)。PDMA使用统计概率分布和分数映射的方法对GOP得分进行修正 以提高机器评分和专家评分的相关度。实验结果表明,使用该算法使修正后的GOP得分与专家评分的句子相关度在实验室已有的基线系统上提高了4.93%。
摘要:本文以语音产生的非线性模型为基础,研究了用于情感语音分类的语音信号能量谱包络下的面积(AUSEES, Area Under the Spectral Energy Envelope of the Speech Signal)和声门波形能量谱包络下的面积(AUSEEG, Area Under the Spectral Energy Envelope of the Glottal Waveform)两种谱能量特征。用模拟人耳听觉特性的Bark尺度频带划分方法对基本的 AUSEES、AUSEEG 特征中的线性平均划分方法进行了改进,生成了基于人耳听觉特性的谱能量AUSEES-Bark、 AUSEEG-Bark特征。将AUSEES-Bark、AUSEEG-Bark特征应用到情感语音识别中,试验的结果表明,改进后的特征识别率有了较大的提高,具有更好的情感分类效果。