首页> 中国专利> 基于注意力的音频和歌词的多模态音乐风格分类方法

基于注意力的音频和歌词的多模态音乐风格分类方法

摘要

本发明涉及音乐风格分类技术领域,涉及一种基于注意力的音频和歌词的多模态音乐风格分类方法,步骤如下:一、数据获取;二、音频预处理:先对音频数据采取Mel频谱特征提取,然后经过CNN网络得到音频特征;三、歌词预处理:先进行BERT预训练得到词向量,然后经过HAN网络得到歌词特征向量;四、attention模间融合:通过Attention模间融合,将获取的音频和歌词特征,进行交互融合获取融合的Attention注意力向量,再与音频和歌词特征向量拼接,获得包含音频和歌词各自模态特征,以及模态间融合特征的音乐风格特征;五、经过softmax层进行分类。本发明能较佳地对数据进行学习和分类。

著录项

  • 公开/公告号CN113177136A

    专利类型发明专利

  • 公开/公告日2021-07-27

    原文格式PDF

  • 申请/专利权人 桂林电子科技大学;

    申请/专利号CN202110460027.9

  • 发明设计人 李优;张志海;常亮;林煜明;周娅;

    申请日2021-04-27

  • 分类号G06F16/65(20190101);G06F16/683(20190101);G06F40/211(20200101);G06F40/216(20200101);G06F40/30(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构51304 成都东恒知盛知识产权代理事务所(特殊普通合伙);

  • 代理人罗江

  • 地址 541004 广西壮族自治区桂林市七星区金鸡路1号

  • 入库时间 2023-06-19 12:00:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-22

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号