机译:一套高效的CUDA和OpenCL内核的基准测试集,以及使用内核调整工具包进行的动态自动调整
Institute of Computer Science Masaryk University Botanická 68a 60200 Brno Czech Republic;
Institute of Computer Science Masaryk University Botanická 68a 60200 Brno Czech Republic Spanish National Centre for Biotechnology Spanish National Research Council Calle Darwin 3 28049 Madrid Spain;
Faculty of Computer Science University of Vienna Währinger Str. 29 Vienna 1090 Austria;
Institute of Computer Science Masaryk University Botanická 68a 60200 Brno Czech Republic Faculty of Computer Science University of Vienna Währinger Str. 29 Vienna 1090 Austria;
Dynamic autotuning; OpenCL; Cuda; Performance optimization; Autotuning benchmark set;
机译:OmpS中针对异构系统的自动调整的OpenCL内核共执行
机译:将动态内核指令用于内核及其应用调整
机译:G核开放集,G核邻域和G核派生集
机译:用于深度神经网络卷积层的OpenCL内核的性能可移植自动调整
机译:基于开花动力学的玉米籽粒结实和异交风险的定量评估
机译:不同氮素利用效率的玉米基因型中氮素供应和碳水化合物有效性对籽粒集和潜在籽粒重量的差异调节
机译:自动调谐OpenCL内核在异构系统中的OMPS中共同执行