首页> 中国专利> 一种基于层级表征网络的视频理解文本生成方法

一种基于层级表征网络的视频理解文本生成方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及视频理解技术领域，其公开了一种基于层级表征网络的视频理解文本生成方法，解决了由于视频信息的复杂性，不能很好地表示多层次概念的视频特征的问题，该方法包括：S1、视频帧特征提取；S2、对提取的视频帧特征进行多层编码，获得事件级、动作级和目标级视觉特征；S3、获取文本嵌套特征，并结合分层的视觉特征通过分层注意力机制获取分层的上下文信息；S4、根据分层的上下文信息利用语言模型生成单词，应用于视频问答任务或视频描述任务。

著录项

公开/公告号CN113779310A

专利类型发明专利
公开/公告日2021-12-10

原文格式PDF
申请/专利权人电子科技大学;
展开▼

申请/专利号CN202111063055.3
发明设计人高联丽;雷雨;曾鹏鹏;宋井宽;
展开▼

申请日2021-09-10
分类号G06F16/783(20190101);
代理机构51226 成都希盛知识产权代理有限公司;
代理人陈泽斌;李培茂
地址 611731 四川省成都市高新区(西区)西源大道2006号
入库时间 2023-06-19 13:40:20

法律信息

法律状态公告日

法律状态信息

法律状态
2023-06-02

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于层级表征网络的视频理解文本生成方法 [P] . 中国专利： CN113779310A . 2021-12-10
2. 一种基于多层级表达引导注意力网络的指示表达理解方法 [P] . 中国专利： CN112488111A . 2021-03-12
3. - METHODS AND APPARATUSES FOR GENERATING TEXT TO VIDEO BASED ON TIME SERIES ADVERSARIAL NEURAL NETWORK [P] . 韩国专利： KR20190125029A . 2019-11-06

机译： -基于时间序列逆神经网络的将文本生成视频的方法和装置
4. - METHODS AND APPARATUSES FOR GENERATING TEXT TO VIDEO BASED ON TIME SERIES ADVERSARIAL NEURAL NETWORK [P] . 韩国专利： KR102042168B1 . 2019-11-07

机译： -基于时间序列逆神经网络的将文本生成视频的方法和装置
5. A method for transmitting an area-based 360 degree video, a method for receiving an area-based 360 degree video, a device for sending an area-based 360 degree video, a device for receiving a 360 degree video based on an area [P] . KR102271444B1 . 2021-07-01

机译：一种用于发送基于面积的360度视频的方法，一种用于接收基于面积的360度视频的方法，一种用于发送基于区域的360度视频的设备，一种用于基于区域接收360度视频的设备