首页> 外国专利> Visual question answering model, electronics, and storage media

Visual question answering model, electronics, and storage media

机译:视觉问答模型,电子设备和存储介质

摘要

PROBLEM TO BE SOLVED: To provide a visual question answering model, an electronic device and a storage medium capable of visual question answering by combining image information and text question information. A visual question answering model is a combination of a text encoder for pooling a word vector sequence of input question text and extracting a semantic expression vector of the question text, and a semantic expression vector of a predetermined image. It includes an image encoder for extracting image features. [Selection diagram] Fig. 1
机译:要解决的问题:提供一种视觉问题回答模型,一种电子设备和一种能够通过组合图像信息和文本问题信息来进行视觉问题回答的存储介质。视觉问题回答模型是文本编码器的组合,该文本编码器用于合并输入问题文本的单词矢量序列并提取问题文本的语义表达矢量和预定图像的语义表达矢量。它包括用于提取图像特征的图像编码器。 [选择图]图1

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号