cache storage; finite difference methods; graphics processing units; parallel processing; performance evaluation; HPC applications; codeless performance upper-bound projection model; data arrays; data dependencies; data traffic; finite difference methods; kernel precedences; memory-bound GPU applications; memory-bound kernels; off-chip memory; on-chip cache; optimal kernel fusions; scalable kernel fusion; Arrays; Graphics processing units; Instruction sets; Kernel; Meteorology; Optimization; System-on-chip;
机译:使用GPU加速基于模板的计算内核,以开发异构系统上的大规模科学应用程序
机译:InK-Compact:内核流压缩及其在通用GPU上的多内核数据可视化中的应用
机译:通过内核融合在GPU上加速显式ODE方法
机译:GPU上的内存绑定BLAS内核的自动线程块大小调整
机译:在最先进的移动GPU上的3D图形应用的动态电压和频率缩放
机译:L2-范数多核学习及其在生物医学数据融合中的应用
机译:GPU内存内核的多功能软件收缩期执行模型
机译:用于激光融合应用的电子束源的缩放。