【24h】

画像内の物体に着目した画像検索に関する検討: RetinaNetを用いた物体認識に基づく高精度化

机译:以图像中的对象为重点的图像搜索检查:基于使用RetinaNet的对象识别的高精度

获取原文

摘要

検索クエリとして文を用いることが可能な画像検索は,ユーザが異なるモダリティを検索する際に,容易 にクエリを用意可能であることが有効点とされている.それらの手法の中で,検索候補の画像にテキストのラベルが 付与されていない状況においても,文をクエリとして検索可能な手法(以降,クロスモーダル検索手法)に対する需要 は高まっており,高精度な手法の構築が期待されている.従来のクロスモーダル検索手法では,クエリ文全体から得 られる文特徴量および検索候補の画像全体から得られる画像特徴量を同一な空間に射影し,比較することで検索が実 現されてきた.しかしながら,従来のクロスモーダル検索手法は,射影の際にクエリの文に含まれる名詞および検索 候補の画像に含まれる物体の情報を損失している可能性が存在する.そこで,本文では,物体認識手法を利用した検 索候補画像の選別による,クロスモーダル検索手法の検索精度向上について検討する.具体的に提案手法では,検索 候補の画像から認識された物体とクエリ文に含まれる名詞の類似度を算出し,画像の選別を行う.その後,選別され た画像を新たな検索候補として,文全体および画像全体に着目することで得られる特徴量に基づき検索を行うことで, クエリ文の名詞に対応する物体が含まれる画像が検索結果として取得されると考えられる.本文の最後では,一般に 公開されているデータセッ卜を用いた実験により提案手法の有効性を確認する.
机译:可以使用句子作为搜索查询的图像搜索非常有效,因为它可以使用户在搜索不同的形式时轻松地准备查询。在这些方法中,搜索候选对象即使在文本标签未贴在图像上的情况下,可以将句子作为查询来搜索的方法(以下称为交叉模态搜索方法)的需求不断增长,并且期望构建高度准确的方法。通过将从整个查询语句获得的语句特征与从整个搜索候选图像获得的图像特征投影到同一空间并将它们进行比较来实现。投影时查询句子中包含的术语和搜索候选图像中包含的对象,因此,在文本中使用对象识别方法,我们将研究交叉模式搜索精度的提高通过使用以上选择搜索候选图像的搜索方法,具体地,在所提出的方法中,确定从搜索候选图像识别的对象与查询语句中包含的术语之间的相似度,然后计算并选择图像。将选择的图像用作新的搜索候选,并基于通过关注整个句子和整个图像而获得的特征量来进行搜索,以对应于查询句子的术语。最后,通过使用公开的数据标签进行的实验证实了该方法的有效性。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号