首页> 外文期刊>Pomiary Automatyka Kontrola >Experimental study on data locality of parallel programs executing synchronization-free threads of computations
【24h】

Experimental study on data locality of parallel programs executing synchronization-free threads of computations

机译:执行无同步计算线程的并行程序数据局部性的实验研究

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

The effective use of hierarchical memory for parallel shared memory programs requires good data locality. Analysis and experimental study on data locality in LID cache for parallel programs executing synchronization-free threads of computations, derived from NAS Parallel Benchmarks, are presented in the paper. Parallel synchronization-free programs were implemented by means of the OpenMP standard. Experiments were carried out in the Intel SMP architecture. The Intel VTune Performance Analyzer was used to collect and evaluate data locality metrics. Finally, a few conclusions about data locality characteristics of synchronization-free parallel programs are given.%Efektywne wykorzystanie współczesnych wieloprocesorowych architektur z pamięcią dzieloną, stosujących kilkupoziomową hierarchię dostępu do danych, wymaga od programów wykonujących równolegle obliczenia w niezależnych wątkach dobrych charakterystyk lokalności danych. W niniejszym artykule przedstawiono badania eksperymentalne oraz analizę lokalności danych dla programów zaczerpniętych ze standardowego zestawu testowego NAS Parallel Benchmark, wykonujących obliczenia w niezależnych wątkach utworzonych przy użyciu dyrektyw równoległych standardu OpenMP. Charakterystyki lokalności danych zostały opracowane dla pierwszego poziomu danych (LID) pamięci cache. Całość badań została wykonana na architekturze Intel SMP z systemem operacyjnym Linux. W celu pozyskania wartości metryk umożliwiających oszacowanie lokalności danych zastosowano narzędzie Intel Vtune Performance Analyzer. Na podstawie uzyskanych obserwacji podjęto próbę sformułowania wniosków końcowych.
机译:对于并行共享存储程序,有效使用分层存储需要良好的数据局部性。本文针对从NAS并行基准中得出的执行无​​同步计算线程的并行程序,对LID缓存中的数据局部性进行了分析和实验研究。并行无同步程序是通过OpenMP标准实现的。实验是在Intel SMP架构中进行的。英特尔VTune性能分析器用于收集和评估数据局部性指标。最后,给出了有关免同步并行程序的数据局部性特征的一些结论。%有效使用共享存储器的现代多处理器体系结构,使用多级数据访问层次结构,要求在独立线程中执行并行计算的程序具有良好的数据局部性特征。本文介绍了从标准NAS并行基准测试套件中提取的程序的实验研究和数据位置分析,这些程序在使用OpenMP并行指令创建的独立线程中执行计算。已经为第一级数据(LID)缓存开发了数据本地化特性。整个研究是在具有Linux操作系统的Intel SMP体系结构上进行的。为了获得能够估算数据局部性的指标值,使用了Intel Vtune Performance Analyzer工具。根据获得的观察结果,试图得出最终结论。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号