本发明提出了一种基于样本均衡和最大均值差异的跨库语音情感识别方法。本方法首先对语音信号进行处理,将其提取为时域与频域信息相结合的语谱图,采用Alexnet网络进一步提取语谱图特征,利用最大均值差异(Maximum Mean Discrepancy,MMD)将源域和目标域特征进行对齐,结合Frobenius范数最大化(Frobenius‑Norm Maximization,FNM),增强了预测矩阵中的模糊样本的可判别性,消除类别间样本数量不平衡的影响,进一步提高了跨库语音情感识别的准确率。
展开▼