Image and Video Captioning with Augmented Neural Architectures

Rakshith Shetty; Hamed R. Tavakoli; Jorma Laaksonen

首页> 外文期刊>IEEE multimedia >Image and Video Captioning with Augmented Neural Architectures

【24h】

Image and Video Captioning with Augmented Neural Architectures

机译：增强型神经体系结构的图像和视频字幕

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Neural-network-based image and video captioning can be substantially improved by utilizing architectures that make use of special features from the scene context, objects, and locations. A novel discriminatively trained evaluator network for choosing the best caption among those generated by an ensemble of caption generator networks further improves accuracy.

机译：通过利用利用场景上下文，对象和位置的特殊功能的体系结构，可以大大改善基于神经网络的图像和视频字幕。一种新颖的经过判别训练的评估器网络，用于在字幕生成器网络集成所生成的字幕中选择最佳字幕，从而进一步提高了准确性。

著录项

来源
《IEEE multimedia》 |2018年第2期|34-46|共13页
作者
Rakshith Shetty; Hamed R. Tavakoli; Jorma Laaksonen;
展开▼
作者单位

Max Planck Institute of Informatics and Saarland University;

Aalto University School of Science and Tampere University of Technology;

Aalto University School of Science;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
Feature extraction; Neural networks; Computational modeling; Multimedia communication; Object recognition; Detectors;

机译：特征提取;神经网络;计算建模;多媒体通信;目标识别;检测器;

相似文献

外文文献
中文文献
专利

1. A neural image captioning model with caption-to-images semantic constructor [J] . Su Jinsong, Tang Jialong, Lu Ziyao, Neurocomputing . 2019,第Nova20期

机译：具有字幕到图像语义构造函数的神经图像字幕模型
2. A Caption Text Detection Method from Images/Videos for Efficient Indexing and Retrieval of Multimedia Data [J] . Samabia Tehsin, Asif Masood, Sumaira Kausar, International Journal of Pattern Recognition and Artificial Intelligence . 2015,第1期

机译：从图像/视频的字幕文本检测方法，以有效地索引和检索多媒体数据
3. Semantic-filtered Soft-Split-Aware video captioning with audio-augmented feature [J] . Xu Yuecong, Yang Jianfei, Mao Kezhi Neurocomputing . 2019,第SEPa10期

机译：具有音频增强功能的语义过滤的“软分割感知”视频字幕
4. Multimodal Deep Neural Network with Image Sequence Features for Video Captioning [C] . Soichiro Oura, Tetsu Matsukawa, Einoshin Suzuki International Joint Conference on Neural Networks . 2018

机译：具有图像序列功能的多模式深度神经网络，用于视频字幕
5. Automatic Video Captioning using Deep Neural Network. [D] . Nguyen, Thang Huy. 2017

机译：使用深度神经网络的自动视频字幕。
6. Gender Recognition from Human-Body Images Using Visible-Light and Thermal Camera Videos Based on a Convolutional Neural Network for Image Feature Extraction [O] . Dat Tien Nguyen, Ki Wan Kim, Hyung Gil Hong, 2017

机译：基于卷积神经网络的可见光和热成像摄像机视频对人体图像的性别识别
7. A Modularized Architecture of Multi-Branch Convolutional Neural Network for Image Captioning [O] . Shan He, Yuanyao Lu 2019

机译：用于图像标题的多分支卷积神经网络的模块化体系结构
8. Effect of Training Data Set Composition on the Performance of a Neural Image Caption Generator. [R] . Wilson, A., Raglin, A. 2017

机译：训练数据集组合对神经图像字幕生成器性能的影响。

Image and Video Captioning with Augmented Neural Architectures

摘要

著录项

相似文献

相关主题

期刊订阅