首页> 外文OA文献 >Modeling performance degradation in OpenMP memory bound applications on multicore multisocket systems
【2h】

Modeling performance degradation in OpenMP memory bound applications on multicore multisocket systems

机译:在多核多插槽系统上的OpenMP内存绑定应用程序中对性能下降进行建模

摘要

L'evolució dels processadors multicore ha canviat completament l'evolució dels actuals sistemes de HPC. Les arquitectures multicore han estat dissenyades principalment per evitar tres barreres de disseny: el paral·lelisme a escala d'instrucció, el consum energètic i la contenció a memòria. La darrera és deguda a la creixent diferència de velocitat entre el processador i la memòria. Les prestacions de les aplicacions intensives a memòria executades en entorns multicore multisocket estan directament relacionades a la utilització dels recursos compartits a la jerarquia de memòria. La utilització dels recursos compartits pot portar a una degradació de les prestacions significativa. L'exploració de diferents configuracions d'afinitat de threads permet la selecció de configuracions que poden arribar a equilibrar la millora de prestacions obtinguda deguda a l'increment del paral·lelisme amb la degradació deguda a la contenció a memòria. Les principals contribucions d'aquesta tesi és la definició d'una metodologia pel desenvolupament d'estratègies de sintonització en entorns multicore multisocket que ha proporcionat la definició de dos models de rendiment per aplicacions intensives a memòria. El primer model de rendiment, basat en una caracterització en temps d'execució, estima el temps d'execució per diferents configuracions de número i distribució de threads en entorns multicore multisocket. Per aquesta finalitat, el model requereix una caracterització exhaustiva en temps d'execució en un únic processador amb l'objectiu de determinar la contenció a memòria. El segon model de rendiment, basat en la pre-caracterització de l'aplicació, estima el temps d'execució i l'impacte de la contenció a memòria per execucions concurrents basat en el perfil del memory footprint extret de traces de la mateixa aplicació executada amb petites càrregues de treball.
机译:多核处理器的发展已完全改变了当前HPC系统的发展。设计多核体系结构主要是为了避免三个设计障碍:指令级并行性,功耗和内存限制。后者是由于处理器和内存之间的速度差异越来越大所致。在多插槽多核环境中运行的内存密集型应用程序的性能与内存层次结构中共享资源的使用直接相关。共享资源的使用可能导致严重的性能下降。对线程亲和力的不同配置的探索允许选择可以到达的配置,以平衡由于并行性的增加而获得的性能的改善与由于对内存的限制而导致的性能下降之间的平衡。本文的主要贡献是定义了在多插槽多核环境中开发调整策略的方法,该方法为内存密集型应用提供了两种性能模型的定义。第一个性能模型基于运行时特征,在多插槽多核环境中估算不同线程号和分发配置的运行时。为此,该模型需要在运行时在单个处理器上进行全面表征,以确定内存容量。第二个性能模型基于应用程序的预先表征,基于从相同执行的应用程序的跟踪中提取的内存占用量分布图,估计执行时间和内存容纳对并发执行的影响工作量很小。

著录项

  • 作者

    Allande Álvarez César;

  • 作者单位
  • 年度 2015
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号