首页> 中国专利> 一种基于多模态分层级信息融合的手语词识别方法

一种基于多模态分层级信息融合的手语词识别方法

摘要

本发明公开了一种基于多模态分层级信息融合的手语词识别方法,该方法包括:以彩色视频、深度视频和骨骼节点视频三种模态的关键帧序列作为网络输入,构建一个双流I3D网络提取彩色视频和深度视频特征,通过特征拼接融合双模态语义特征,再使用LSTM构建长期时空特征,使用SoftMax进行分类评分;同时使用DST‑GCN网络提取骨骼节点视频的时空特征,再使用SoftMax进行分类评分;最终通过决策级融合方式将两个SoftMax层的预测分数进行融合,得到手语词识别结果。本发明所提出的基于多模态分层级信息融合的手语词识别方法,通过构建分层级融合策略,充分利用了多模态数据互补信息;通过构建DST‑GCN网络,增强了时空图卷积网络时间特征提取能力,进而提高了手语词识别的准确率。

著录项

  • 公开/公告号CN113297955B

    专利类型发明专利

  • 公开/公告日2022-03-18

    原文格式PDF

  • 申请/专利权人 中国矿业大学;

    申请/专利号CN202110559367.7

  • 申请日2021-05-21

  • 分类号G06V40/20(20220101);G06V10/80(20220101);G06V10/764(20220101);G06V10/82(20220101);G06V10/62(20220101);G06K9/62(20220101);G06N3/04(20060101);

  • 代理机构32203 南京理工大学专利中心;

  • 代理人朱沉雁

  • 地址 221116 江苏省徐州市铜山区大学路一号

  • 入库时间 2022-08-23 13:16:47

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-18

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号