首页> 中国专利> 一种基于多头注意力机制的语音情感识别方法

一种基于多头注意力机制的语音情感识别方法

摘要

本发明公开了一种基于多头注意力机制的语音情感识别方法,语音情感识别是近年来人机交互领域中极具挑战性的问题。本发明使用短时能量和短时平均过零率的双门限方法对语音信号进行有声断与无声断的检测以减少分类识别模型中运算的数据量,并通过MFCC特征提取方法获取语音信号的人工情感特征;由于传统的情感特征提取方法使用卷积神经网络使得模型复杂度高,并且该方法只能提取人工特征图中的空间特征忽略时间信息,所以本发明使用多头注意力机制捕捉信息间长距离的依赖关系,缩减模型复杂度,获得语音信号的时空情感特征;使用长短时记忆网络进一步刻画情感特征,在时间维度上获得更好的长期依赖关系。最后将获得的具有较高时间相关性的情感特征送入分类器中进行识别,以获得较高的情感分类结果。

著录项

  • 公开/公告号CN113628639A

    专利类型发明专利

  • 公开/公告日2021-11-09

    原文格式PDF

  • 申请/专利权人 哈尔滨理工大学;

    申请/专利号CN202110764366.6

  • 发明设计人 张锐;王佳颖;

    申请日2021-07-06

  • 分类号G10L25/63(20130101);G10L25/24(20130101);G10L15/16(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构

  • 代理人

  • 地址 150000 黑龙江省哈尔滨市南岗区学府路52号

  • 入库时间 2023-06-19 13:12:12

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号