首页> 中文会议>第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016） >基于Spatial-DCTHash动态参数网络的视觉问答算法

基于Spatial-DCTHash动态参数网络的视觉问答算法

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来,随着深度学习的应用和多模态的深入研究,问答系统从传统的文本问答扩展到结合图片的视觉问答,成为计算机视觉与自然语言理解的交叉研究热点之一.Hyeonwoo Noh等人在CVPR2016中提出一种简单、有效的动态参数预测模型(Dynamic Parameter Prediction Network,DPPnet),但是此模型仅在空域滤波器上进行Hash,得到权重位置是随机的,没有考虑利用图像的空间信息.对于如何利用图像的空间信息以提高模型性能,本文采用类似Fully Convolutional Network的方式改造传统的VGGnet卷积神经网络,提取具有空间信息的图像特征,在此基础上,提出一种新的空间离散余弦哈希动态参数网络来结合问题特征和图像特征预测视觉答案.本文在COCOqa和MSCOCO-VQA数据集上与已有的方法进行了对比实验,实验结果表明本文的算法在性能上有较大提高.

著录项

来源
《第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016）》||1-11|共11页
会议地点烟台
作者
Meng Xiangshen; 孟祥申; Jiang Aiwen; 江爱文; Liu Changhong; 刘长红; Ye Jihua; 叶继华; Wang Mingwen; 王明文;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类
关键词
文本信息; 视觉问答; 离散余弦变换; 卷积神经网络;

相似文献

中文文献
外文文献
专利

1. 基于动态参数调整的小波神经网络盲均衡算法 [J] . 赵慧青 ,万智萍 . 计算机工程 . 2016,第006期
2. 基于参数调整的动态模糊神经网络算法 [J] . 张德丰 ,周灵 ,孙亚民 . 计算机工程 . 2010,第006期
3. 基于空间注意力推理机制的视觉问答算法研究 [J] . 李智涛 ,周之平 ,叶琴 . 计算机应用研究 . 2021,第003期
4. 基于多模态推理图神经网络的场景文本视觉问答模型 [J] . 张海涛 ,郭欣雨 . 计算机应用研究 . 2022,第1期
5. 基于图卷积网络的视觉问答研究 [J] . 龚安 ,丁磊 ,姚鑫杰 . 计算机与数字工程 . 2022,第1期
6. 动态贝叶斯网络参数学习算法的一种加速 [C] . 莫富强 ,王浩 ,姚宏亮 . 中国仪器仪表学会第九届青年学术会议 . 2007
7. 基于深度学习的视觉问答算法研究 [A] . 李莎莎 . 2020

基于Spatial-DCTHash动态参数网络的视觉问答算法

摘要

著录项

相似文献

相关主题

期刊订阅