首页> 中国专利> 一种基于反思网络的教学场景视频描述生成方法

一种基于反思网络的教学场景视频描述生成方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于反思网络的教学场景视频描述生成方法，包括如下步骤：步骤1)视频图像预处理阶段；步骤2)图像特征抽取阶段；步骤3)数据集标注预处理阶段；步骤4)图像特征编码阶段；步骤5)文本解码阶段。本发明具有的有益效果是：是能够很好地针对常见教学视频生成高质量、精细化的描述性句子。提出将反思网络应用于教学场景的视频描述任务,使得网络通过一个两阶段解码器的反思过程,就可在序列解码过程中同时检查前后的内容，从而可以利用全局信息生成描述。

著录项

公开/公告号CN112528883A

专利类型发明专利
公开/公告日2021-03-19

原文格式PDF
申请/专利权人杭州义顺科技有限公司;南京众智未来人工智能研究院有限公司;
展开▼

申请/专利号CN202011483140.0
发明设计人于长斌;段晨瑞;朱铭健;孙晓彤;靳伟;于凤敏;
展开▼

申请日2020-12-15
分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G06F40/126(20200101);G06F40/151(20200101);
代理机构33213 杭州浙科专利事务所(普通合伙);
代理人周红芳
地址 310026 浙江省杭州市西湖区金蓬街368号6幢5层
入库时间 2023-06-19 10:19:37

法律信息

法律状态公告日

法律状态信息

法律状态
2023-02-28

发明专利申请公布后的撤回 IPC(主分类):G06K 9/00 专利申请号:2020114831400 申请公布日:20210319

发明专利申请公布后的撤回

相似文献

专利
中文文献
外文文献

1. 一种基于反思网络的教学场景视频描述生成方法 [P] . 中国专利： CN112528883A . 2021-03-19
2. 一种基于长短时记忆网络变体的视频描述生成方法 [P] . 中国专利： CN111818397B . 2021.10.08
3. Method for learning driving of car and/or educational teaching by video representation of scenario of pre-established events, involves using scenario in form of video game in network in which people act as authors by achieving role [P] . 法国专利： FR2981188A1 . 2013-04-12

机译：通过预先建立的事件的场景的视频表示来学习汽车驾驶和/或教育教学的方法，涉及在网络中以视频游戏的形式使用场景，其中人们通过扮演角色来扮演作者
4. System and method of video Telecommunication to compress and decompress The Video Data of color digitalThe present Invention relates to a method for compressing a digital color Video Data in a Telecommunication System Video that has a means for generating a video signal that is uN means for generating a video signal to a Plurality of color video framerate,With Every Frame Image consisting of a Plurality of Scanning Lines composed of a Plurality of pixelsAnd each pixel in the image Frame consists of the components of color digitalThe Method comprises the steps of determining a function); Luminance pixel based on at least one of the three components of color digital(b) identify at least one parameter decision for at least a significant portion of pixels in the scanlines of a Table of current image based on the difference ofThe role in Luminance between the pixels at a Predetermined distance from at least one pixel in each Scan line and at least a (c) comparison of decision parameter with [P] . MX166516B . 1993-01-11

机译：用于压缩和解压缩彩色数字视频数据的视频电信系统和方法技术领域本发明涉及一种用于压缩电信系统视频中数字彩色视频数据的方法，该方法具有用于生成视频信号的装置，该装置是用于生成视频信号的装置。将视频信号转换为多个彩色视频帧速率，每个帧图像由多个扫描线组成，扫描线由多个像素组成，图像中的每个像素由彩色数字分量组成（该方法包括确定功能的步骤）;基于彩色数字（b）的三个分量中的至少一个的亮度像素，基于两个像素之间的亮度差异，针对当前图像表的扫描线中的至少大部分像素，确定至少一个参数决策。与每条扫描线中至少一个像素相距预定距离的像素，以及至少（c）比较决策参数与
5. VIDEO DESCRIPTION GENERATION METHOD BASED ON NEURAL NETWORK, AND MEDIUM, TERMINAL AND APPARATUS [P] . 世界知识产权组织专利： WO2020077858A1 . 2020-04-23

机译：基于神经网络，媒介，终端和设备的视频描述生成方法