首页> 中国专利> 一种基于自注意力机制的多模态LSTM的视频动作预测方法

一种基于自注意力机制的多模态LSTM的视频动作预测方法

页面导航

摘要
著录项
相似文献

摘要

本发明涉及一种基于自注意力机制的多模态LSTM的视频动作预测方法，该方法包括以下步骤：步骤1：准备训练数据集并针对原视频进行预处理得到RGB图片和光流图片；步骤2：基于RGB图片和光流图片通过TSN网络提取RGB特征和光流特征，基于训练数据集通过Faster‑RCNN目标检测器得到与目标检测相关的特征；步骤3：建立基于自注意力机制的多模态LSTM网络模型，并将步骤2中得到的RGB特征和光流特征以及与目标检测相关的特征输入至该网络模型中训练，输出各自对应的动作种类分布张量；步骤4：建立融合网络为动作种类分布张量分配权重并与动作种类分布张量相结合得到最终视频动作预测结果。与现有技术相比，本发明具有准确率高，解决了较长的动作预测时间效果不佳的缺陷。

著录项

公开/公告号CN111914731A

专利类型发明专利
公开/公告日2020-11-10

原文格式PDF
申请/专利权人上海电力大学;
展开▼

申请/专利号CN202010738071.7
发明设计人邵洁;莫晨;
展开▼

申请日2020-07-28
分类号G06K9/00(20060101);G06K9/46(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构31225 上海科盛知识产权代理有限公司;
代理人孙永申
地址 200090 上海市杨浦区平凉路2103号
入库时间 2023-06-19 08:50:28

相似文献

专利
中文文献
外文文献

1. 一种基于自注意力机制的多模态LSTM的视频动作预测方法 [P] . 中国专利： CN111914731A . 2020-11-10
2. 一种基于注意力机制和LSTM的管网漏损量预测方法及系统 [P] . 中国专利： CN113434989A . 2021-09-24
3. An apparatus for determining an action based on a situation, a vehicle which is capable of determining an action based on a situation, a method of an action based on a situation and a method for controlling the vehicle [P] . KR102339443B1 . 2021-12-16

机译：一种用于基于情况的动作确定动作的装置，该车辆能够基于情况确定动作的车辆，一种基于情况的动作的方法和用于控制车辆的方法
4. VARMA LSTM Battery Output Voltage Response and State-of-Charge Forecasting Method using Hybrid VARMA and LSTM [P] . KR102297343B1 . 2021-09-01

机译： Varma LSTM电池输出电压响应和使用混合Varma和LSTM的充电状态预测方法
5. TRANSFORMER DGA DATA PREDICTION METHOD BASED ON MULTI-DIMENSIONAL TIME SEQUENCE FRAME CONVOLUTION LSTM [P] . US2021089900A1 . 2021-03-25

机译：基于多维时间序列框架卷积LSTM的变压器DGA数据预测方法