University of Toronto (Canada).;
机译:FPGA上的OpenCL内核的优化实现
机译:一套高效的CUDA和OpenCL内核的基准测试集,以及使用内核调整工具包进行的动态自动调整
机译:OpenCL-Darknet:基于OpenCL的深度学习对象检测框架的实现与优化
机译:OpenCL FPGA核优化的设计与性能评估
机译:opencl内核执行在多个设备上的分布。
机译:使用具有OpenCL的SoC优化深层神经网络
机译:优化OpenCL™内核用于频域图像使用图像矢量化技术的高升压滤波器