首页> 外文OA文献 >Performance improvement methodology based on divisible load theory for data intensive applications
【2h】

Performance improvement methodology based on divisible load theory for data intensive applications

机译:基于可分负载理论的性能改进方法,用于数据密集型应用

摘要

L'augment de la quantitat de dades que necessiten ser processades actualment, representa un dels majors reptes a l' ambit de la computaci o. Aix o ha perm es el creixement d'aplicacions amb requeriments especials conegudes com aplicacions intensives en dades. En general, per afavorir l'execuci o en paral lel de aquest tipus d'aplicacions, les dades d'entrada son partits en trossos m es petits que poden ser processats individualment. No obstant aix o, en molts casos, aquestes aplicacions mostren problemes graus de rendiment, deguts principalment a desequilibris de c arrega, l' us ine cient dels recursos de c omput disponibles, i inadequades pol tiques de partici o i distribuci o de les dades. A m es, l'impacte d'aquests problemes de rendiment es pot veure acrescut pel comportament din amic de l'aplicaci o. Aquest treball proposa una metodologia per a millorar, din amicament, el rendiment d'aplicacions intensives en dades, basat en: (i) l'adaptaci o de la grand aria i nombre de les particions de dades amb la nalitat de reduir el temp d'execuci o total; i (ii) l'adaptaci o del nombre de nodes de c omput per aconseguir una execuci o e cient. Proposem observar el comportament de l'aplicaci o per cada iteraci o (o consulta) i utilitzar les dades recollides per a ajustar din amicament el seu rendiment. La metodologia assumeix que cada execuci o inclou m ultiples consultes relacionades sobre una unica c arrega de treball partida. L'ajust del factor de partici o de la c arrega de treball es fa mitjan cant la de nici o de la grand aria inicial dels trossos de dades; la modi caci o de la pol tica de plani caci o (per a enviar primerament els trossos amb major temps d'execuci o); la divisi o dels trossos amb major temps d'execuci o; i el agrupament de trossos de dades amb temps de c omput massa curts. Els criteris per a decidir si el trossos es divideixen o es agrupen estan basats en els temps d'execuci o associats a cada tros (com el temps mitj a i la desviaci o est andard) aix com tamb e en el nombre de nodes de c omputs que s'estan utilitzant. A m es a m es, el referent a l' us de recursos de c omput es va abordar mitjan cant l'avaluaci o din amica del rendiment de l'aplicaci o, juntament amb l'estimaci o i modi caci o del nombre de nodes de processament que es puguin utilitzar e cientment. Hem avaluat la nostra proposta usant aplicacions intensives en dades reals i sint etiques. Aix com tamb e hem analitzat les expressions anal tiques propostes mitjan cant simulaci o. Despr es d'aplicar la nostra metodologia, hem obtingut resultats prometedors en la reducci o del temps total d'execuci o i l' us e cient dels recursos. Paraules claus: balanceig de c arrega; an alisi i sintonitzaci o din amic del rendiment; aplicacions intensives en dades; c arrega arbitr ariament divisible.
机译:今天,需要处理的数据量不断增加,这代表了计算领域的最大挑战之一。这使具有特殊要求的应用程序(称为数据密集型应用程序)得以增长。通常,为了促进此类应用程序的执行或并行执行,将输入数据分为较小的部分,可以单独处理。但是,或者在许多情况下,这些应用程序表现出性能问题,这主要是由于负载不平衡,可用计算资源的使用效率低下以及数据共享和分发策略不足所致。另外,应用程序的友好应用程序行为可能会加剧这些性能问题的影响。本文提出了一种动态改善数据密集型应用程序性能的方法,该方法基于:(i)适应大面积和大量数据分区,以减少数据处理时间。 '共跑; (ii)调整计算节点的数量以实现有效执行。我们建议观察应用程序或每次迭代或(或查询)的行为,并使用收集的数据动态调整其性能。该方法假设每次运行都包含单个拆分工作负载上的多个相关查询。分区因子或工作量的调整是通过数据块的角度或初始大面积来完成的;修改计划策略(首先发送执行时间最长的片段);具有较长执行时间的片段或片段;或并以太短的计算时间将数据分组。决定将块拆分还是分组的标准是基于执行时间或与每个块相关联的(例如,平均时间,偏差或标准)以及计算节点的数量。正在使用。另外,通过动态评估应用程序的性能以及估计或修改处理节点的数量来解决计算资源的使用。可以有效地使用它。我们使用数据密集型和道德密集型应用程序评估了我们的提案。我们还分析了通过仿真提出的解析表达式。应用我们的方法后,我们在减少总执行时间和有效利用资源方面取得了可喜的成果。关键词:负载均衡;表演的同伴和调音或晚餐朋友;数据密集型应用程序; c加载任意可分。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号