首页> 中国专利> 一种基于多模态分层级信息融合的手语词识别方法

一种基于多模态分层级信息融合的手语词识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于多模态分层级信息融合的手语词识别方法，该方法包括：以彩色视频、深度视频和骨骼节点视频三种模态的关键帧序列作为网络输入，构建一个双流I3D网络提取彩色视频和深度视频特征，通过特征拼接融合双模态语义特征，再使用LSTM构建长期时空特征，使用SoftMax进行分类评分；同时使用DST‑GCN网络提取骨骼节点视频的时空特征，再使用SoftMax进行分类评分；最终通过决策级融合方式将两个SoftMax层的预测分数进行融合，得到手语词识别结果。本发明所提出的基于多模态分层级信息融合的手语词识别方法，通过构建分层级融合策略，充分利用了多模态数据互补信息；通过构建DST‑GCN网络，增强了时空图卷积网络时间特征提取能力，进而提高了手语词识别的准确率。

著录项

公开/公告号CN113297955B

专利类型发明专利
公开/公告日2022-03-18

原文格式PDF
申请/专利权人中国矿业大学;
展开▼

申请/专利号CN202110559367.7
发明设计人王军;吕智成;申政文;李玉莲;潘在宇;鹿姝;
展开▼

申请日2021-05-21
分类号G06V40/20(20220101);G06V10/80(20220101);G06V10/764(20220101);G06V10/82(20220101);G06V10/62(20220101);G06K9/62(20220101);G06N3/04(20060101);
代理机构32203 南京理工大学专利中心;
代理人朱沉雁
地址 221116 江苏省徐州市铜山区大学路一号
入库时间 2022-08-23 13:16:47

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-18

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于多模态分层级信息融合的手语词识别方法 [P] . 中国专利： CN113297955A . 2021-08-24
2. 一种基于颜色和深度信息的多模态融合手势识别方法 [P] . 中国专利： CN107025442B . 2020.05.01
3. 一种基于变分自编码器的训练样本数据扩充方法、存储介质及计算机设备 [P] . 世界知识产权组织专利： WO2020/143321A1 . 2020.07.16