Stencil computation; NVidia GPU; Warp shuffle; Register caching; Shared memory; Loop tiling;
机译:评估减少GPGPU中模板计算的全局内存访问的优化
机译:评估减少GPGPU中的模板计算的GlobalMemory访问的优化
机译:模板代码的高度优化代码生成以及GPU的计算复用
机译:在大于GPU的存储容量的域上进行模板计算的并行优化方法
机译:在GPU上优化模板计算
机译:DOPA:使用数据库和内存访问优化的基于GPU的蛋白质比对
机译:用于现代CPU和GPU上模版计算的3.5d块优化