首页> 中国专利> 基于卷积神经网络的视频描述方法及装置

基于卷积神经网络的视频描述方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明实施例提供一种基于卷积神经网络的视频描述方法及装置，针对待描述视频提取出视觉特征序列后，将该视觉特征序列输入至编码器，由编码器对视觉特征序列进行计算，得到待描述视频的各视频帧的状态向量，然后根据各状态向量确定出平均池化结果并输入至解码器，由解码器根据平均池化结果生成与待描述视频相对应的描述结果。该过程中，利用基于卷积神经网络的编码器‑解码器对待描述视频进行描述，以得到符合人类自然语言且不呆板的描述结果，从而提升视频描述结果。基于卷积神经网络的编码器的前向卷积结构使得计算能够并行化，能够对待描述视频的长序列依赖关系进行建模，解码器能够避免递归神经网络容易出现的梯度弥散和爆炸问题。

著录项

公开/公告号CN111325068A

专利类型发明专利
公开/公告日2020-06-23

原文格式PDF
申请/专利权人北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司;
展开▼

申请/专利号CN201811536611.2
发明设计人潘滢炜;姚霆;梅涛;
展开▼

申请日2018-12-14
分类号G06K9/00(20060101);G06F16/78(20190101);G06N3/04(20060101);G06N3/08(20060101);
代理机构11205 北京同立钧成知识产权代理有限公司;
代理人荣甜甜;刘芳
地址 100195 北京市海淀区知春路76号8层
入库时间 2023-12-17 09:38:14

法律信息

法律状态公告日

法律状态信息

法律状态
2020-06-23

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于卷积神经网络的视频描述方法及装置 [P] . 中国专利： CN111325068A . 2020-06-23
2. 基于多模态注意力机制的视频内容描述方法、系统、装置 [P] . 中国专利： CN111079601A . 2020-04-28
3. Method and apparatus for convolutional neural network-based video denoising [P] . US11151694B2 . 2021-10-19

机译：基于卷积神经网络的视频去噪的方法和装置
4. METHOD AND APPARATUS FOR VIDEO SUPER RESOLUTION USING CONVOLUTIONAL NEURAL NETWORK WITH TWO-STAGE MOTION COMPENSATION [P] . 美国专利： US2020294217A1 . 2020-09-17

机译：基于两阶段运动补偿的卷积神经网络视频超分辨率的方法和装置
5. METHOD AND APPARATUS FOR VIDEO SUPER RESOLUTION USING CONVOLUTIONAL NEURAL NETWORK WITH TWO-STAGE MOTION COMPENSATION [P] . 美国专利： US2019139205A1 . 2019-05-09

机译：基于两阶段运动补偿的卷积神经网络视频超分辨率的方法和装置