首页> 中国专利> 基于多特征融合和时空注意力机制相结合的视频描述方法

基于多特征融合和时空注意力机制相结合的视频描述方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于多特征融合和时空注意力机制相结合的视频描述方法，首先对待描述视频提取多种基于卷积神经网络的特征，包括物体、场景、行为动作以及光流等特征，并将这些特征融合拼接成一个特征向量，然后基于时空注意力机制的双向长短时记忆网络确定视频的语义编码表达，最后输入到单向长短时记忆网络模型进行特征解码，从而获得与所述视频对应的自然语言描述句子。本发明对待描述视频分别提取了物体、场景以及运动特征，表征了视频的对象信息与对象之间的关系以及运动信息，同时考虑到视频在空间维度和时间维度上的变化，利用3D卷积特征进一步捕捉到视频流的运动信息。

著录项

公开/公告号CN108388900B

专利类型发明专利
公开/公告日2021-06-08

原文格式PDF
申请/专利权人华南理工大学;
展开▼

申请/专利号CN201810110287.1
发明设计人李楚怡;余卫宇;
展开▼

申请日2018-02-05
分类号G06K9/46(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构44245 广州市华学知识产权代理有限公司;
代理人李斌
地址 510640 广东省广州市天河区五山路381号
入库时间 2022-08-23 11:56:08

相似文献

专利
中文文献
外文文献

1. 基于多特征融合和时空注意力机制相结合的视频描述方法 [P] . 中国专利： CN108388900B . 2021.06.08
2. 一种基于时空及通道的多注意力机制视频描述方法 [P] . 中国专利： CN109101948B . 2021.06.04
3. METHOD AND SYSTEM FOR COMBINING VIDEO SEQUENCES WITH SPATIO-TEMPORAL ALIGNMENT [P] . IN2006DN01928A . 2014-11-28

机译：将视频序列与时空对齐相结合的方法和系统
4. METHOD AND SYSTEM FOR COMBINING VIDEO SEQUENCES WITH SPATIO-TEMPORAL ALIGNMENT [P] . CA2318375C . 2008-08-05

机译：将视频序列与时空对齐相结合的方法和系统
5. SYSTEM AND METHOD FOR COMBINING ADVANCED DATA PARTITIONING AND FINE GRANULARITY SCALABILITY FOR EFFICIENT SPATIO-TEMPORAL-SNR SCALABILITY VIDEO CODING AND STREAMING [P] . 欧洲知识产权局专利： EP1671486A1 . 2006-06-21

机译：高效时空SNR可扩展性视频编码和流处理的高级数据分区和精细粒度可扩展性相结合的系统和方法