multi-core processor; thread-level parallelism; thread par-titioning; speculative multithreading; program hot path;
机译:基于接线盒的接触检测算法的性能比较和基于并行化的新改进技术
机译:利用基于知识的技术开发循环并行化的新模型
机译:线程分区和值预测,以利用推测性线程级并行性
机译:统一循环并行化,提高基于热路径的线程划分技术的性能
机译:沿波前和基于波前的技术进行循环展开,以利用指令和线程级并行性。
机译:使用Crumble和Prune进行元对齐:对非常大的对齐问题进行分区以实现性能和并行化
机译:表5:根据使用内存聚结技术是否使用基于GPU的平行实施的性能(CUDA块的数量= 16,每个块= 256的线数)。