机译:针对所选并行CUDA应用程序的统一内存和动态并行性的性能评估
Gdansk Univ Technol, Fac Elect Telecommun & Informat, Gdansk, Poland;
Gdansk Univ Technol, Fac Elect Telecommun & Informat, Gdansk, Poland;
CUDA; Dynamic parallelism; Unified memory; Parallel programming;
机译:对NVIDIA Pascal和Volta GPU上的选定并行CUDA应用程序进行预取和超额预订的统一内存的性能评估
机译:使用应用程序的基于并行度的性能评估方法
机译:细粒度,不规则工作负载的动态并行性能评估
机译:在矢量化中利用超循环并行性来提高CUDA GPGPU上的内存性能
机译:为具有依赖性和不规则内存访问的应用程序启用有效的并行性
机译:CUDA中统一内存访问性能的调查
机译:NVIDIA Pascal和Volta GPU中所选并行CUDA应用的预取和超订阅统一内存的绩效评估