...
【24h】

ハッシュを用いた最大類似度探索法に関する研究

机译:哈希的最大相似性搜索方法研究

获取原文
获取原文并翻译 | 示例
           

摘要

データベース中から入力に対して最も距離の小さいデータを探索する最近傍探索アルゴリズムは,固定次元ベクトルで表現できるデータに対して,距離の公理を満足する尺度を用いた場合にしか適用できない.このような条件を満足しない指紋の照合問題などでは,類似度を最大化するデータを検索する最大類似度探索が用いられる.この手法については,従来様々な方法が研究されてきており,前田らの提案したマッチングスコア行列を用いた最大類似度探索法は高速性と精度の両面で優れた性能を持つことが知られている.ただし,このマッチングスコア行列は,登録したデータ間のマッチングスコアを全て記憶するものであり,データ数の2乗のオーダのメモリを消費するため,数十万個のデータを記録し,最大類似度探索を行うことはほぼ不可能である.本研究では,不定次元パターンを独立性の高い複数のパターンとのマッチングスコア行列を用いて固定次元ベクトル化し,さらにわれわれの提案しているPrincipal Component Hashingと組み合わせることにより,高速な最大類似度探索を実現する方法を提案する.実験を通じて,この提案手法がマッチングスコア行列のサイズを小さくし,高速かつ高精度な最大類似度探索が行えることを実証する.
机译:从数据库中搜索到从数据库的输入,最近的最近搜索算法只能应用于可以由固定尺寸向量表示的数据,只有在满足令人满意的距离的度量时,才会被占用。在指纹整理问题中不满足使用条件,用于搜索数据以最大化相似性的最大相似性搜索。对于这种方法,已经研究了各种方法,并且已知使用匹配分数矩阵的MAEDA最大相似性搜索的提议在高度中具有出色的性能速度和准确性。但是,这种匹配的分数矩阵存储了注册数据之间的所有匹配分数,以消耗数据的顺序顺序中的数据数量的数量,几乎不可能录制数十万个数据和执行最大相似性搜索。在本研究中,不定尺寸模式使用具有多个独立模式的匹配得分矩阵的固定维度矢量化,并且进一步提出了一种通过与所提出的主体组合实现高速最大相似性搜索的方法组件散列。通过实验,该提出的方法表明可以减少匹配得分矩阵的尺寸,并且可以执行高速和高精度的最大相似性搜索。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号