首页> 中国专利> 一种基于ViLBERT和BiLSTM的图像描述方法

一种基于ViLBERT和BiLSTM的图像描述方法

摘要

本发明提供一种基于ViLBERT和BiLSTM的图像描述方法,其特征在于,包括:将待描述图像进行特征提取处理并输入至图像描述模型中进行处理得到图片描述信息,其中,图像描述模型通过如下预先训练过程获得:获取训练图像集以及对应的图像文本信息;对训练图像集进行特征提取得到图像特征信息;通过文本处理transformer块对图像文本信息进行处理得到文本特征信息;对图像特征信息以及文本特征信息分别进行一个联合注意力transformer层处理,再分别经过一个transformer块处理以及分别经过加权处理模块处理得到图像特征;使用Att‑LSTM的输入数据以及上一层Att‑LSTM的输出,再使用Lan‑LSTM的输入数据以及上一层Lan‑LSTM的输出,最后输出将输入至softmax中得到对应的单词;使用交叉熵损失函数对图像描述模型进行训练。

著录项

  • 公开/公告号CN113780350A

    专利类型发明专利

  • 公开/公告日2021-12-10

    原文格式PDF

  • 申请/专利权人 上海电力大学;

    申请/专利号CN202110912994.4

  • 发明设计人 温蜜;许昊;种法广;

    申请日2021-08-10

  • 分类号G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构31204 上海德昭知识产权代理有限公司;

  • 代理人郁旦蓉

  • 地址 200090 上海市杨浦区沪城环路1851号

  • 入库时间 2023-06-19 13:40:20

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号