首页> 外文期刊>IEEE multimedia >Image and Video Captioning with Augmented Neural Architectures
【24h】

Image and Video Captioning with Augmented Neural Architectures

机译:增强型神经体系结构的图像和视频字幕

获取原文
获取原文并翻译 | 示例
           

摘要

Neural-network-based image and video captioning can be substantially improved by utilizing architectures that make use of special features from the scene context, objects, and locations. A novel discriminatively trained evaluator network for choosing the best caption among those generated by an ensemble of caption generator networks further improves accuracy.
机译:通过利用利用场景上下文,对象和位置的特殊功能的体系结构,可以大大改善基于神经网络的图像和视频字幕。一种新颖的经过判别训练的评估器网络,用于在字幕生成器网络集成所生成的字幕中选择最佳字幕,从而进一步提高了准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号