Artificial Neural Networks; Embedded GPU; TensorRT; Real-time; NVIDIA Jetson; Image processing; YOLO; CUDA;
机译:使用CUDA在nVIDIA GPU上D3Q19晶格Boltzmann内核的性能分析和优化策略
机译:映射代数的编译方法:自动并行化,地区优化和光栅空间分析的GPU加速度
机译:用多GPU并行计算与多网格和时间步骤方法的多GPU并行计算枝晶晶格Boltzmann模拟枝晶叶片模拟
机译:在嵌入式CPU-GPUS MPSoC上结合任务和数据级并行性,用于高吞吐量CNN推断
机译:在典型的系统配置中,使用启用了CUDA的GPU进行加密算法加速。
机译:基于张量的基于CUDA优化的嵌入式GPU上的并行加速用于神经网络推理
机译:基于TensoR的CUDA优化,用于使用平行加速度嵌入式GPU的ANN推断