首页> 外文期刊>RSTI >Une démarche conjointe de fragmentation et de placement dans le cadre des entrepôts de données parallèles
【24h】

Une démarche conjointe de fragmentation et de placement dans le cadre des entrepôts de données parallèles

机译:在并行数据仓库环境中进行碎片和放置的联合方法

获取原文
获取原文并翻译 | 示例
           

摘要

Traditionnellement, concevoir un entrepôt de données parallèle consiste d'abord à partitionner son schéma et ensuite à allouer les fragments générés sur les nœuds d'une machine parallèle. L'inconvénient majeur d'une telle approche est son ignorance de l'interdépendance entre les processus de fragmentation et d'allocation. Une des entrées du problème d'allocation est l'ensemble de fragments générés par la fragmentation. Notons que les deux processus cherchent à optimiser le même ensemble de requêtes. Dans ce papier, nous proposons une approche de conception d'un entrepôt de données relationnel parallèle selon une architecture distribuée (shared nothing) intégrant les processus de fragmentation et d'allocation. Ensuite, une méthode de répartition de charges sur les nœuds de la machine parallèle est proposée. Finalement, une validation de nos propositions en utilisant le banc d'essai APB-1 release II est présentée.%Traditionally, designing a parallel data warehouse consists in first fragmenting its schema and then allocating the generated fragments over the nodes of a parallel machine. The main drawback of such approach is that it does not take into account the interdependency between fragmentation and allocation processes. Note that the number of fragments is one of the inputs of the allocation problem. Both processes optimize the same set of queries defined on the parallel data warehouse. In this paper, we propose a new approach for designing parallel relational data warehouses supported by shared nothing architecture, where fragmentation and allocation processes are done simultaneously. To ensure a high performance of queries, a load balancing method is proposed. Finally, a validation of our algorithms using APB-1 release II benchmark is presented.
机译:传统上,设计并行数据仓库首先涉及分区其架构,然后分配在并行计算机的节点上生成的片段。这种方法的主要缺点是无视碎片和分配过程之间的相互依赖性。分配问题的输入之一是碎片产生的碎片集合。请注意,这两个过程试图优化同一组请求。在本文中,我们提出了一种根据集成了碎片和分配过程的分布式体系结构(无共享)设计并行关系数据仓库的方法。然后,提出了一种在并行机节点上进行负载分配的方法。最后,提出了使用APB-1第II版测试平台对我们的建议进行的验证。%传统上,设计并行数据仓库的步骤是先对其架构进行分段,然后在并行计算机的节点上分配生成的分段。这种方法的主要缺点是它没有考虑到碎片和分配过程之间的相互依赖性。请注意,碎片数是分配问题的输入之一。这两个过程都会优化在并行数据仓库上定义的同一组查询。在本文中,我们提出了一种新的方法来设计由无共享体系结构支持的并行关系数据仓库,其中碎片和分配过程是同时完成的。为了保证查询的高性能,提出了一种负载均衡的方法。最后,介绍了使用APB-1 Release II基准测试对我们算法的验证。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号