...
首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >分散環境におけるL_1距離ベースLocality-Sensitive Hashingの通信回数削減手法とその実装評価
【24h】

分散環境におけるL_1距離ベースLocality-Sensitive Hashingの通信回数削減手法とその実装評価

机译:基于L_1距离的局域散列通信频率降低方法及其在分布式环境中的实现评估

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Locality-Sensitive Hashing(LSH)は高次元データに対する近似最近接点探索アルゴリズムである.LSH は高速な反面,ハッシュテーブルを複数個使用するため空間計算量が非常に大きい.そのため,大規模なデータに適用するには,LSHを複数計算機に分散して実現する技術が必要になる.LSHを分散環境で実現する場合,単純には各ノードにハッシュテーブルを均等に固定数ずつ配置する手法が考えられる.しかし,この方法では検索時に全ハッシュテーブルへアクセスする際に多数のリモートアクセスが発生し,通信がボトルネックとなる分散環境では応答時間が長くなる.本研究ではハッシュバケツの配置を工夫し,同じデータを含む異なるハッシュテーブル上のハッシュバケツをなるべく同じノード上に配置する方式を提案する.提案方式ではクエリ処理時に1回のリモートアクセスで複数のハッシュバケツへアクセスできるので,リモートアクセス回数が削減される.
机译:局部敏感哈希(LSH)是一种针对高维数据的近似最近接触搜索算法。尽管LSH速度很快,但是由于使用多个哈希表,因此它使用了大量的空间计算。因此,为了将其应用于大规模数据,需要一种将LSH分发到多台计算机的技术。当在分布式环境中实现LSH时,可以考虑一种简单地在每个节点上均匀排列固定数量的哈希表的方法。但是,使用这种方法时,在搜索过程中访问所有哈希表时会发生大量的远程访问,并且在通信成为瓶颈的分布式环境中,响应时间会变长。在这项研究中,我们设计了哈希桶的排列方式,并提出了一种在不同节点上尽可能多地将哈希桶排列在包含相同数据的不同哈希表上的方法。在所提出的方法中,在查询处理期间可以通过一个远程访问来访问多个哈希桶,从而减少了远程访问的次数。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号