...
首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >分散環境におけるL_1距離ベースLocality-Sensitive Hashingの通信回数削減手法とその実装評価
【24h】

分散環境におけるL_1距離ベースLocality-Sensitive Hashingの通信回数削減手法とその実装評価

机译:L_1基于距离的距离的位置敏感散列通信减速方法及其在分布式环境中的安装评估

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Locality-Sensitive Hashing(LSH)は高次元データに対する近似最近接点探索アルゴリズムである.LSH は高速な反面,ハッシュテーブルを複数個使用するため空間計算量が非常に大きい.そのため,大規模なデータに適用するには,LSHを複数計算機に分散して実現する技術が必要になる.LSHを分散環境で実現する場合,単純には各ノードにハッシュテーブルを均等に固定数ずつ配置する手法が考えられる.しかし,この方法では検索時に全ハッシュテーブルへアクセスする際に多数のリモートアクセスが発生し,通信がボトルネックとなる分散環境では応答時間が長くなる.本研究ではハッシュバケツの配置を工夫し,同じデータを含む異なるハッシュテーブル上のハッシュバケツをなるべく同じノード上に配置する方式を提案する.提案方式ではクエリ処理時に1回のリモートアクセスで複数のハッシュバケツへアクセスできるので,リモートアクセス回数が削減される.
机译:位置敏感散列(LSH)是高维数据的近似最近的联系人搜索算法。空间计算量非常大,因为LSH是高速,并且使用多个散列表。因此,为了适用于大规模数据,需要一种用于分布分布和由多台计算机实现的LSH的技术。当在分布式环境中实现LSH时,一种简单地将散列表放置在每个节点上的方法同样是固定数量的固定数字。然而,在该方法中,在搜索时访问整个哈希表时发生大量远程访问,并且在通信是瓶颈的分布式环境中,响应时间变长。在这项研究中,我们设计了散列桶的排列,并提出了一种在不同哈希表上放置散列桶的方法,包括与相同的数据尽可能多。在该方法中,由于查询处理时的一个远程访问可以访问多个哈希桶,因此减少了远程访问的数量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号