首页> 中国专利> 利用自适应的时空图模型通过提升视频-语言表征学习来解决视频问答问题的方法及其系统

利用自适应的时空图模型通过提升视频-语言表征学习来解决视频问答问题的方法及其系统

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种利用自适应的时空图模型通过提升视频‑语言表征学习来解决视频问答问题的方法及其系统，属于视频问答文本生成领域。首先，针对一组视频、问题、答案训练集，使用目标检测器获取每个视频帧的目标级别的信息。其次，对于目标级别的信息，使用自适应的时空图模型学到目标的动态表达。最后，使用Transformer模型学习视觉和文本信息之间的联系，增强视觉问答的性能。相比于一般的视频问答解决方案，本发明利用了自适应的时空图模型更好地获取了目标的时空动态信息，同时试图将不同视频帧的相同物体联系起来，更好地捕获动态信息，并采用了图片‑语言数据进行预训练来提升视频‑语言模型，提升了解决视频问答问题的效果。

著录项

公开/公告号CN111652202B

专利类型发明专利
公开/公告日2020-12-01

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN202010795917.0
发明设计人赵洲;何金铮;金韦克;
展开▼

申请日2020-08-10
分类号G06K9/00(20060101);G06K9/32(20060101);G06K9/62(20060101);G06N3/04(20060101);G06F16/332(20190101);G06F16/9537(20190101);
代理机构33200 杭州求是专利事务所有限公司;
代理人郑海峰
地址 310058 浙江省杭州市西湖区余杭塘路866号
入库时间 2022-08-23 11:23:58

相似文献

专利
中文文献
外文文献

1. 利用自适应的时空图模型通过提升视频-语言表征学习来解决视频问答问题的方法及其系统 [P] . 中国专利： CN111652202B . 2020.12.01
2. 利用自适应的时空图模型通过提升视频-语言表征学习来解决视频问答问题的方法及其系统 [P] . 中国专利： CN111652202A . 2020-09-11
3. A deterrent and enforcement solution to address the problems caused as a result of mobile phone whilst driving. This innovative solution combines the use of highly visible vehicles monitoring the road network that will carry public messaging of the laws relating to mobile phone use while driving thereby deterring the behaviour. The solution also utilises mobile video surveillance of drivers activities within their vehicles, and where any phone use in a vehicle is perceived to have occurred it will be provided to the relevant authorities from the video recordings for their enforcement decision. [P] . AU2016101933A4 . 2016-12-01

机译：一种威慑和强制解决方案，用于解决驾驶时因手机引起的问题。这种创新的解决方案结合了使用高可见性的车辆来监视道路网络的功能，该车辆将在驾驶时向公众传递有关使用手机的法律信息，从而阻止行为。该解决方案还利用移动视频监视驾驶员在其车辆内的活动，并且在感觉到车辆发生任何电话使用的情况下，将从视频记录中将其提供给相关机构，以供其执行决策。
4. SYSTEM AND METHOD FOR VIDEO NOISE REDUCTION USING MOTION AND EDGE ADAPTIVE TEMPORAL-SPATIAL FILTERING [P] . SG130964A1 . 2007-04-26

机译：利用运动和边缘自适应时空滤波减少视频噪声的系统和方法
5. LEARNING SYSTEM FOR PROVIDING QUESTIONS BY DIFFICULTY LEVEL WITH DIFFICULTY LEVEL UPDATING FUNCTION BY USING STANDARD AVERAGE RATE OF CORRECT ANSWER AND STANDARD AVERAGE PROBLEM-SOLVING TIME OF LEARNER [P] . 韩国专利： KR20150135584A . 2015-12-03

机译：利用正确答案的标准平均率和学习者的平均问题解决时间通过难度等级和难度更新功能来提供问题的学习系统