基于深度卷积与全局特征的图像密集字幕描述

武文博; 顾广华; 刘青茹; 赵志明; 李刚

首页> 中文期刊> 《信号处理》 >基于深度卷积与全局特征的图像密集字幕描述

基于深度卷积与全局特征的图像密集字幕描述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了解决图像密集字幕描述中感兴趣区域(Regions of interest,ROI)定位不准确与区域粗粒度描述问题,本文提出了一种基于深度卷积与全局特征的图像密集字幕描述算法,该算法采用残差网络与并行LSTM(Long Short Term Memory)网络的联合模型对存在的区域重叠定位和粗粒度描述细节信息不完整问题进一步改进.首先利用深度残差网络与Faster R-CNN(Faster R-Convolutional Neural Network)的RPN(Regional Proposal Network)层获取更精准区域边界框,以便避免区域标记重叠;然后将全局特征、局部特征和上下文特征信息分别输入并行LSTM网络且采用融合算子将三种不同输出整合以获得最终描述语句.通过在公开数据集上与两种主流算法对比表明本文模型具有一定优越性.

著录项

来源
《信号处理》 |2020年第9期|1525-1532|共8页
作者
武文博; 顾广华; 刘青茹; 赵志明; 李刚;
展开▼
作者单位

燕山大学信息科学与工程学院河北秦皇岛066004;

河北省信息传输与信号处理重点实验室河北秦皇岛066004;

燕山大学信息科学与工程学院河北秦皇岛066004;

河北省信息传输与信号处理重点实验室河北秦皇岛066004;

燕山大学信息科学与工程学院河北秦皇岛066004;

河北省信息传输与信号处理重点实验室河北秦皇岛066004;

燕山大学信息科学与工程学院河北秦皇岛066004;

河北省信息传输与信号处理重点实验室河北秦皇岛066004;

燕山大学信息科学与工程学院河北秦皇岛066004;

河北省信息传输与信号处理重点实验室河北秦皇岛066004;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工） ;
关键词
密集字幕生成; 并行长短时记忆网络; Faster R-CNN ; 感兴趣区域 ; 特征融合 ;

相似文献

中文文献
外文文献
专利

1. 基于密集卷积网络的单目图像深度估计方法 [J] . 王亚群 ,戴华林 ,王丽 . 计算机工程 . 2021 ,第011期
2. 一种基于密集深度分离卷积的SAR图像水域分割算法 [J] . 张金松 ,邢孟道 ,孙光才 . 雷达学报 . 2019 ,第003期
3. 基于复杂网络描述的图像深度卷积分类方法 [J] . 洪睿 ,康晓东 ,郭军 . 计算机应用 . 2018 ,第012期
4. 基于卷积神经网络的图像特征描述方法 [J] . 马金盾 ,张雷 ,郭理彬 . 兵器装备工程学报 . 2021 ,第009期
5. 基于卷积神经网络的局部图像特征描述符算法 [J] . 石国强 ,赵霞 ,陈星洲 . 上海航天 . 2020 ,第001期
6. 用于图像检索的多区域交叉加权聚合深度卷积特征 [C] . Dong Rongsheng ,董荣胜 ,Cheng Deqiang . 2017中国计算机辅助设计与图形学大会（2017 China CADCG） . 2017
7. 基于深度学习的图像密集字幕描述生成研究 [A] . 武文博 . 2020

基于深度卷积与全局特征的图像密集字幕描述

摘要

著录项

相似文献

相关主题

期刊订阅