机译:通过Megakernels实现GPU上的高效快速卷积算法
Peking Univ Ctr Energy Efficient Comp & Applicat Beijing 100871 Peoples R China;
Peking Univ Ctr Energy Efficient Comp & Applicat Beijing 100871 Peoples R China;
Peking Univ Ctr Energy Efficient Comp & Applicat Beijing 100871 Peoples R China;
Peking Univ Ctr Energy Efficient Comp & Applicat Beijing 100871 Peoples R China;
Sensetime Grp Hong Kong Peoples R China;
Kernel; Convolution; Task analysis; Graphics processing units; Tensile stress; Instruction sets; Libraries;
机译:卷积神经网络的一种快速且节省内存的GPU加速算法,用于目标检测
机译:GPU体系结构上计算电磁的快速高效算法
机译:基于快速多项式和快速W变换的高效循环卷积算法
机译:GPNPU:在GPU Tensor内核中通过多精度支持实现高效的基于硬件的直接卷积
机译:高效的内存一致性和一致性支持,以便在GPU中启用数据共享
机译:具有多个GPU上高效回溯例程的蛋白质比对算法
机译:通过Megakernels实现GPU上的高效快速卷积算法