首页> 中国专利> 基于自然语言描述的视频监控行人搜索图像文本融合方法

基于自然语言描述的视频监控行人搜索图像文本融合方法

摘要

一种基于自然语言描述的视频监控行人搜索图像文本融合方法,包括:设卷积神经网络提取的第n张图像特征向量为In,所述第n张图像对应的自然语言描述中含有若干个单词,其中,第k个单词的文本特征向量为将第n张图像特征向量In分别与第n张图像对应的自然语言描述中每个单词的文本特征向量进行融合,从而找到该自然语言描述中每个单词与该第n张图像的对应关系。本发明是为了视频监控的行人搜索可以更好的应用于实际之中,从而使用一段自然语言描述进行行人搜索而不采用属性搜索行人的方式。将一段自然语言描述中的单词文本特征向量分别与对应的图像特征向量可以更有效的融合,从而得到适用于自然语言描述的视频监控的行人搜索的融合特征向量。

著录项

  • 公开/公告号CN109145763B

    专利类型发明专利

  • 公开/公告日2021-07-13

    原文格式PDF

  • 申请/专利权人 天津大学;

    申请/专利号CN201810844143.9

  • 发明设计人 冀中;李晟嘉;

    申请日2018-07-27

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06F16/583(20190101);

  • 代理机构12201 天津市北洋有限责任专利代理事务所;

  • 代理人杜文茹

  • 地址 300072 天津市南开区卫津路92号

  • 入库时间 2022-08-23 12:07:48

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号