首页> 中国专利> 一种基于文本自编码器的视频内容描述方法

一种基于文本自编码器的视频内容描述方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于文本自编码器的视频内容描述方法。本发明方法首先构建卷积神经网络提取视频的二维和三维特征；其次，构建文本自编码器，即分别用编码器‑文本卷积网络提取文本隐空间特征和解码器‑多头注意力残差网络重构文本；再次，通过自注意力机制及全连接映射得到估计文本隐空间特征；最后，通过自适应矩估计算法交替优化上述模型，对新视频利用已构建的文本自编码器和卷积神经网络得到对应的视频内容描述。本发明方法通过文本自编码器的训练可充分挖掘视频内容语义和视频文本描述的潜在关系，通过自注意力机制捕捉视频长时间跨度的动作时序信息，提高了模型的计算效率，从而生成更符合视频真实内容的文本描述。

著录项

公开/公告号CN111079532B

专利类型发明专利
公开/公告日2021-07-13

原文格式PDF
申请/专利权人杭州电子科技大学;
展开▼

申请/专利号CN201911108029.0
发明设计人李平;张致远;徐向华;
展开▼

申请日2019-11-13
分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构33240 杭州君度专利代理事务所(特殊普通合伙);
代理人杨舟涛
地址 310018 浙江省杭州市下沙高教园区2号大街
入库时间 2022-08-23 12:07:13

相似文献

专利
中文文献
外文文献

1. 一种基于文本自编码器的视频内容描述方法 [P] . 中国专利： CN111079532B . 2021.07.13
2. 一种基于深度学习和文本总结的视频描述方法 [P] . 中国专利： CN105279495B . 2019.06.04
3. digital media content extraction system, lesson generation and presentation, digital media content extraction and lesson generation system, video transmission and associated audio or text channel analysis system and automatic exercise generation learning based on the data extracted from the channel and system for video streaming analysis and automatic generation of a lesson based on the data extracted from the video streaming [P] . BR112018015114A2 . 2018-12-18

机译：数字媒体内容提取系统，课程生成和演示，数字媒体内容提取和课程生成系统，视频传输及相关的音频或文本通道分析系统以及基于从通道中提取的数据的自动运动生成学习以及用于视频流分析和分析的系统根据从视频流中提取的数据自动生成课程
4. FAKEOUT© Software System - An electronic apostille-based real time content authentication technique for text, audio and video transmissions [P] . 美国专利： US2019273618A1 . 2019-09-05

机译： FAKEOUT©软件系统-一种基于电子教皇的实时内容认证技术，用于文本，音频和视频传输
5. The storage media present information to utilizau00c7u00e7o with a device of gravau00c7u00e7o / reproduu00c7u00e7o, method of reproduu00c7u00e7o subtitle data in text format, and the data of audio / video (AV), a device for data reproduu00c7u00e7o audio / video (AV) and subtitle data in text format, M. u00cddia of gravau00c7u00e7o passu00cdvel reading in the computer.Method for control of a device for data sincronizau00c7u00e7o audio / video (AV) with the subtitle data in text format, media present passu00cdvel reading in the computer, and method of reproduu00c7u00e7o subtitle data in text format in sicronizau00c7u00e7o with data of audio / video (AV) [P] . BRPI0507879A2 . 2009-03-10

机译：存储介质使用grava u00c7 u00e7o / reprodu u00c7 u00e7o设备，reprod u00c7 u00e7o文本格式的字幕数据以及音频 /视频数据（ AV），一种用于以文本格式复制音频 /视频（AV）和字幕数据的设备，M。 grava u00c7 u00e7o通过计算机中的读取控制设备的方法用于带有文本格式字幕数据的数据sincroniza u00c7 u00e7o音频//视频（AV），计算机中媒体当前通过 u00cdvel读取以及以sicroniza u00c7 文本格式复制字幕数据的方法u00e7o带有音频 /视频（AV）数据