首页> 中文期刊> 《信号处理 》 >基于深度卷积与全局特征的图像密集字幕描述

基于深度卷积与全局特征的图像密集字幕描述

             

摘要

为了解决图像密集字幕描述中感兴趣区域(Regions of interest,ROI)定位不准确与区域粗粒度描述问题,本文提出了一种基于深度卷积与全局特征的图像密集字幕描述算法,该算法采用残差网络与并行LSTM(Long Short Term Memory)网络的联合模型对存在的区域重叠定位和粗粒度描述细节信息不完整问题进一步改进.首先利用深度残差网络与Faster R-CNN(Faster R-Convolutional Neural Network)的RPN(Regional Proposal Network)层获取更精准区域边界框,以便避免区域标记重叠;然后将全局特征、局部特征和上下文特征信息分别输入并行LSTM网络且采用融合算子将三种不同输出整合以获得最终描述语句.通过在公开数据集上与两种主流算法对比表明本文模型具有一定优越性.

著录项

  • 来源
    《信号处理 》 |2020年第9期|1525-1532|共8页
  • 作者单位

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省信息传输与信号处理重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省信息传输与信号处理重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省信息传输与信号处理重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省信息传输与信号处理重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省信息传输与信号处理重点实验室 河北秦皇岛066004;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工) ;
  • 关键词

    密集字幕生成; 并行长短时记忆网络; Faster R-CNN ; 感兴趣区域 ; 特征融合 ;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号