首页> 中国专利> 一种基于自注意力机制的多模态LSTM的视频动作预测方法

一种基于自注意力机制的多模态LSTM的视频动作预测方法

摘要

本发明涉及一种基于自注意力机制的多模态LSTM的视频动作预测方法,该方法包括以下步骤:步骤1:准备训练数据集并针对原视频进行预处理得到RGB图片和光流图片;步骤2:基于RGB图片和光流图片通过TSN网络提取RGB特征和光流特征,基于训练数据集通过Faster‑RCNN目标检测器得到与目标检测相关的特征;步骤3:建立基于自注意力机制的多模态LSTM网络模型,并将步骤2中得到的RGB特征和光流特征以及与目标检测相关的特征输入至该网络模型中训练,输出各自对应的动作种类分布张量;步骤4:建立融合网络为动作种类分布张量分配权重并与动作种类分布张量相结合得到最终视频动作预测结果。与现有技术相比,本发明具有准确率高,解决了较长的动作预测时间效果不佳的缺陷。

著录项

  • 公开/公告号CN111914731A

    专利类型发明专利

  • 公开/公告日2020-11-10

    原文格式PDF

  • 申请/专利权人 上海电力大学;

    申请/专利号CN202010738071.7

  • 发明设计人 邵洁;莫晨;

    申请日2020-07-28

  • 分类号G06K9/00(20060101);G06K9/46(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构31225 上海科盛知识产权代理有限公司;

  • 代理人孙永申

  • 地址 200090 上海市杨浦区平凉路2103号

  • 入库时间 2023-06-19 08:50:28

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号