首页> 外文期刊>Computing and informatics >PARALLEL RETRIEVAL OF DENSE VECTORS IN THE VECTOR SPACE MODEL
【24h】

PARALLEL RETRIEVAL OF DENSE VECTORS IN THE VECTOR SPACE MODEL

机译:向量空间模型中的密度矢量的并行检索

获取原文
获取原文并翻译 | 示例

摘要

Modern information retrieval systems use distributed and parallel algorithms to meet their operational requirements, and commonly operate on sparse vectors; but dimensionality-reducing techniques produce dense and relatively short feature vectors. Motivated by this relevance of dense vectors, we have parallelized the vector space model for dense matrices and vectors. Our algorithm uses a hybrid partitioning splitting documents and features and operates on a mesh of hosts holding a block partitioned corpus matrix. We show that the theoretic speed-up is optimal. The empirical evaluation of an MPI-based implementation reveals that we obtain a super-linear speed-up on a cluster using Nehalem Xeon CPUs.
机译:现代信息检索系统使用分布式和并行算法来满足其操作要求,并且通常在稀疏矢量上进行操作。但是降维技术会产生密集且相对较短的特征向量。由于稠密向量的这种相关性,我们对稠密矩阵和向量进行了向量空间模型的并行化。我们的算法使用混合分割来分割文档和特征,并在拥有块状分割语料矩阵的主机网格上运行。我们证明理论上的加速是最佳的。对基于MPI的实现进行的经验评估表明,我们使用Nehalem Xeon CPU在集群上获得了超线性加速。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号