首页> 外文OA文献 >Parallel H.264/AVC motion compensation for GPUs using OpenCL
【2h】

Parallel H.264/AVC motion compensation for GPUs using OpenCL

机译:使用OpenCL的GPU的并行H.264 / AVC运动补偿

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Motion compensation is one of the most compute-intensive parts in H.264/AVC video decoding. It exposes massive parallelism, which can reap the benefit from graphics processing units (GPUs). Control and memory divergence, however, may lead to performance penalties on GPUs. In this paper, we propose two GPU motion-compensation kernels, implemented with OpenCL, that mitigate the divergence effect. In addition, the motion-compensation kernels have been integrated into a complete and optimized H.264/AVC decoder that supports high-profile H.264/AVC. We evaluated our kernels on GPUs with different architectures from AMD, Intel, and Nvidia. Compared with the fastest CPU used in this paper, our kernel achieves 2.0 speedup on a discrete Nvidia GPU at kernel level. However, when the overheads of memory copy and OpenCL runtime are included, no speedup is gained at application level.
机译:运动补偿是H.264 / AVC视频解码中计算量最大的部分之一。它暴露出大量的并行性,可以从图形处理单元(GPU)中受益。但是,控制和内存的差异可能会导致GPU的性能下降。在本文中,我们提出了两个用OpenCL实现的GPU运动补偿内核,它们可以缓解发散效应。此外,运动补偿内核已集成到完整且经过优化的H.264 / AVC解码器中,该解码器支持高端H.264 / AVC。我们在AMD,Intel和Nvidia具有不同架构的GPU上评估了我们的内核。与本文中使用的最快CPU相比,我们的内核在内核级别的离散Nvidia GPU上实现了2.0的加速。但是,如果包括内存复制和OpenCL运行时的开销,则无法在应用程序级别获得加速。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号