首页> 外文OA文献 >Design of scalable PGAS collectives for NUMA and manycore systems
【2h】

Design of scalable PGAS collectives for NUMA and manycore systems

机译:用于NUMA和manycore系统的可扩展PGAS集合的设计

摘要

[Resumen] El número de núcleos por procesador está creciendo, convirtiendo a los sistemas multinúcleo en omnipresentes. Esto implica lidiar con múltiples niveles de memoria en sistemas NUMA, accesibles a través de complejas jerarquías para procesar las crecientes cantidades de datos. La clave para un movimiento eficiente y escalable de datos es el uso de operaciones de comunicación colectivas que minimizen el impacto de los cuellos de botella. Usar comunicaciones unilaterales se vuelve más importante en estos sistemas, para evitar sincronizaciones entre pares de procesos en operaciones colectivas implementadas usando funciones punto a punto bilaterales. Esta tesis propone una serie de algoritmos que proporcionan buen rendimiento y escalabilidad en operaciones colectivas. Estos algoritmos usan árboles jerárquicos, solapamento de comunicaciones unilaterais, pipelining de mensajes y afinidad NUMA. Se ha desarrollado una implementación para UPC, un lenguaje PGAS cuyo rendimiento también ha sido evaluado en esta tesis. Para comprobar el rendimiento de estos algoritmos una nueva herramienta de microbenchmarking fue diseñada e implementada. La evaluación de los algoritmos, realizada en 6 sistemas representativos, con 5 arquitecturas de procesador y 5 redes de interconexión diferentes, ha mostrado en general un buen rendimiento y escalabilidad, mejor que los algoritmos líderes en MPI en muchos casos, lo que confirma el potencial de los algoritmos desarrollados para arquitecturas multi- y manycore.
机译:[摘要]每个处理器的内核数量正在增长,从而使多核系统无处不在。这涉及在NUMA系统上处理多个级别的内存,可通过复杂的层次结构访问这些内存以处理不断增加的数据量。有效和可伸缩的数据移动的关键是使用集体通信操作,以最大程度地减少瓶颈的影响。在这些系统中,使用单边通信变得更加重要,以避免在使用双边点对点功能实现的集体操作中的成对过程之间进行同步。本文提出了一系列算法,这些算法可在集体操作中提供良好的性能和可伸缩性。这些算法使用层次树,单边通信重叠,消息流水线和NUMA相似性。已经为UPC(一种PGAS语言)开发了一种实现,其性能也已在本文中进行了评估。为了检查这些算法的性能,设计并实现了一种新的微基准测试工具。在具有5个处理器体系结构和5个不同互连网络的6个代表性系统上进行的算法评估通常显示出良好的性能和可伸缩性,在许多情况下均优于领先的MPI算法,从而证实了其潜力针对多核和多核架构开发的算法。

著录项

  • 作者

    Álvarez Mallón Damián;

  • 作者单位
  • 年度 2014
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号