首页> 外文OA文献 >Réplication de données dans les systèmes de gestion de données à grande échelle
【2h】

Réplication de données dans les systèmes de gestion de données à grande échelle

机译:大规模数据管理系统中的数据复制

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Ces dernières années, la popularité croissante des applications, e.g. les expériences scientifiques, Internet des objets et les réseaux sociaux, a conduit à la génération de gros volumes de données. La gestion de telles données qui de plus, sont hétérogènes et distribuées à grande échelle, constitue un défi important. Dans les systèmes traditionnels tels que les systèmes distribués et parallèles, les systèmes pair-à-pair et les systèmes de grille, répondre à des objectifs tels que l'obtention de performances acceptables tout en garantissant une bonne disponibilité de données constituent des objectifs majeurs pour l'utilisateur, en particulier lorsque ces données sont réparties à travers le monde. Dans ce contexte, la réplication de données, une technique très connue, permet notamment: (i) d'augmenter la disponibilité de données, (ii) de réduire les coûts d'accès aux données et (iii) d'assurer une meilleure tolérance aux pannes. Néanmoins, répliquer les données sur tous les nœuds est une solution non réaliste vu qu'elle génère une consommation importante de la bande passante en plus de l'espace limité de stockage. Définir des stratégies de réplication constitue la solution à apporter à ces problématiques. Les stratégies de réplication de données qui ont été proposées pour les systèmes traditionnels cités précédemment ont pour objectif l'amélioration des performances pour l'utilisateur. Elles sont difficiles à adapter dans les systèmes de cloud. En effet, le fournisseur de cloud a pour but de générer un profit en plus de répondre aux exigences des locataires. Satisfaire les attentes de ces locataire en matière de performances sans sacrifier le profit du fournisseur d'un coté et la gestion élastiques des ressources avec une tarification suivant le modèle 'pay-as-you-go' d'un autre coté, constituent des principes fondamentaux dans les systèmes cloud. Dans cette thèse, nous proposons une stratégie de réplication de données pour satisfaire les exigences du locataire, e.g. les performances, tout en garantissant le profit économique du fournisseur. En se basant sur un modèle de coût, nous estimons le temps de réponse nécessaire pour l'exécution d'une requête distribuée. La réplication de données n'est envisagée que si le temps de réponse estimé dépasse un seuil fixé auparavant dans le contrat établi entre le fournisseur et le client. Ensuite, cette réplication doit être profitable du point de vue économique pour le fournisseur. Dans ce contexte, nous proposons un modèle économique prenant en compte aussi bien les dépenses et les revenus du fournisseur lors de l'exécution de cette requête. Nous proposons une heuristique pour le placement des répliques afin de réduire les temps d'accès à ces nouvelles répliques. De plus, un ajustement du nombre de répliques est adopté afin de permettre une gestion élastique des ressources. Nous validons la stratégie proposée par une évaluation basée sur une simulation. Nous comparons les performances de notre stratégie à celles d'une autre stratégie de réplication proposée dans les clouds. L'analyse des résultats obtenus a montré que les deux stratégies comparées répondent à l'objectif de performances pour le locataire. Néanmoins, une réplique de données n'est crée, avec notre stratégie, que si cette réplication est profitable pour le fournisseur.
机译:近年来,诸如科学实验,物联网和社交网络之类的应用的日益普及导致了大量数据的产生。而且,管理这样的数据是异构的并且广泛分布的,构成了重要的挑战。在诸如分布式和并行系统,对等系统和网格系统之类的传统系统中,满足诸如实现可接受的性能同时确保良好的数据可用性的目标是以下目标:用户,尤其是当这些数据分布在世界各地时。在这种情况下,数据复制是一种非常众所周知的技术,它特别允许:(i)提高数据的可用性,(ii)降低访问数据的成本,以及(iii)确保更好的容忍度故障。但是,在所有节点上复制数据是不切实际的解决方案,因为除了有限的存储空间外,它还会产生大量带宽消耗。定义复制策略是解决这些问题的方法。已经针对上述传统系统提出的数据复制策略的目的是提高用户的性能。它们很难适应云系统。实际上,云提供商的目标是除了满足租户的要求外,还可以产生利润。原则是在不牺牲供应商利润的前提下满足这些租户的期望,而在另一侧遵循“按需付款”模式进行定价的方式来灵活地管理资源,这是原则云系统的基础知识。在本文中,我们提出了一种数据复制策略,以在满足供应商经济利益的同时满足租户的性能要求。基于成本模型,我们估计执行分布式查询所需的响应时间。仅当估计响应时间超过供应商和客户之间建立的合同中预先确定的阈值时,才考虑数据复制。这样,从供应商的经济角度出发,这种复制必须是有利可图的。在这种情况下,我们提出了一种经济模型,该模型考虑了执行此请求期间供应商的费用和收入。我们提出一种放置副本的试探法,以减少对这些新副本的访问时间。另外,对余震的数量进行调整以允许弹性管理资源。我们通过基于仿真的评估来验证所提出的策略。我们将我们的策略的性能与云中提供的另一种复制策略的性能进行了比较。对获得的结果进行的分析表明,比较的两种策略可以满足租户的绩效目标。但是,只有该复制对供应商有利可图时,才根据我们的策略创建数据复制。

著录项

  • 作者

    Tos Uras;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号