首页> 中国专利> 一种基于注意力机制3D残差网络的镜头运动识别方法

一种基于注意力机制3D残差网络的镜头运动识别方法

摘要

本发明公开了一种基于注意力机制3D残差网络的镜头运动识别方法,包括如下步骤:步骤一:构建镜头运动数据集;步骤二:构建含注意力机制的3D残差网络;步骤三:利用所述镜头运动数据集训练含注意力机制的3D残差网络,得到训练后的网络模型;步骤四:将待识别镜头运动的视频片段输入训练后的网络模型,从而得到镜头运动类别。本发明基于注意力机制3D残差网络的镜头运动识别方法是一种端到端的方法,相比基于光流/运动矢量场的镜头运动识别方法,含注意力的3D残差网络的计算效率高。同时,由于注意力机制的使用以及3D残差网络一定程度上融合了前后帧的信息,有效地增强了模型对于运动目标干扰的鲁棒性。

著录项

  • 公开/公告号CN112016434A

    专利类型发明专利

  • 公开/公告日2020-12-01

    原文格式PDF

  • 申请/专利权人 安徽索贝数码科技有限公司;

    申请/专利号CN202010864657.8

  • 发明设计人 温序铭;陆维琛;

    申请日2020-08-25

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);

  • 代理机构51214 成都九鼎天元知识产权代理有限公司;

  • 代理人钱成岑

  • 地址 230051 安徽省合肥市包河区花园大道与泰山路交口东南角滨湖卓越城文华园7号楼701室

  • 入库时间 2023-06-19 09:04:30

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号