CPUとGPU間のデータ転送時間の短縮に関する研究

机译：缩短CPU与GPU之间的数据传输时间的研究

代理获取

本网站仅为用户提供外文OA文献查询和代理获取服务，本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文，但由于OA文献来源多样且变更频繁，仍可能出现获取不到、文献不完整或与标题不符等情况，如果获取不到我们将提供退款服务。请知悉。

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

近年、GPUを利用して一般的な並列プログラミングを行う手法は、高性能コンピューティングでよく見られる方法である。また、NVIDIA社のCUDAに代表されるGPU向けの開発環境が整備され、元々汎用的なプログラムの記述が困難であるGPU向けのプログラミングも手軽に行えるようになった。しかし、GPUで演算するためには、CPUとGPU間のデータ転送が必要であり、計算時間よりもデータの転送時間が大きい場合がある。CUDA2.2では、Memory Copy以外のデータ転送方式Zero Copy方式を用意した。データがCPU上のMapped Memoryに保存され、メモリのアドレス空間をCPUとGPU間でマッピングすることにより、GPUがCPUのメモリ上のデータを直接アクセスすることができ、CPUとGPU間のデータ転送時間の短縮が期待される。しかし、Zero Copy方式を使う際に、GPU側のメモリ内に保存されていないデータへのアクセス回数が多い場合、逆に性能が落ちる可能性がある。本研究では、CPUとGPU間のデータ転送時間の短縮を目指し、データアクセス回数を基づいて適切なデータ転送方式の選択手法を提案する。アクセス回数が2回以上のデータだけGPU側のメモリにMemory Copyにより転送してアクセスし、アクセス回数が1回のデータについてはZero Copy方式により転送する。さらに本研究では、Zero Copy方式のメモリ領域確保の方法と通常のデータ転送と違うため、コードの変更が必要となり、プログラマの負担となっている一点に着目し、より容易にデータ転送方式を変更できるCUDA APIを提案する。APIはプログラマの選択により、各データのメモリ領域申請や、必要に応じてデータ転送や、メモリ領域の解放などを自動的に行う。k-Nearest Neighbors問題の評価実験によって実行時間の比較を行った結果、提案したデータ転送方式と従来データ転送方式に比べて12%の実行時間の短縮ができた。また、API使用前後の実行時間の比較により、API使用時のオーバーヘッドは十分小さいことが示した。

机译：近年来，使用GPU的通用并行编程方法是在高性能计算中经常发现的方法。此外，以NVIDIA CUDA为代表的GPU的开发环境已得到改善，并且原本难以编写通用程序的GPU编程现在可以轻松执行。但是，在GPU上执行计算需要CPU和GPU之间的数据传输，并且数据传输时间可能比计算时间长。在CUDA2.2中，准备了数据复制方法“零复制”方法，而不是“内存复制”。数据存储在CPU的映射内存中，通过在CPU与GPU之间映射内存的地址空间，GPU可以直接访问CPU内存中的数据，从而可以减少CPU与GPU之间的数据传输时间。预计会缩短。但是，使用零复制方法时，如果对未保存在GPU侧内存中的数据的访问次数很高，则性能可能受到不利影响。在这项研究中，我们提出了一种基于数据访问次数选择合适的数据传输方法的方法，旨在减少CPU和GPU之间的数据传输时间。通过内存复制，只有被访问两次以上的数据才被传输到GPU侧的内存中，并且通过零复制方法传输一次已被访问的数据。此外，在这项研究中，由于零复制方法和常规数据传输的存储区保护方法不同，因此有必要更改代码，重点是给程序员带来负担的一点，并且更改数据传输方法更容易。建议可以做到这一点的CUDA API。 API会自动为每个数据选择存储区，并在必要时传输数据，并根据程序员的选择释放存储区。通过k最近邻问题的评估实验比较执行时间，与建议的数据传输方法和常规数据传输方法相比，执行时间减少了12％。另外，通过比较使用API之前和之后的执行时间，表明使用API时的开销足够小。

著录项

作者
沈峻;
展开▼
作者单位

展开▼
年度 2016
总页数
原文格式 PDF
正文语种 ja
中图分类

相似文献

外文文献
中文文献
专利

1. ドクターヘリ運用効果の可視化と関連施設の配置計画に関する研究: 医療行為開始までの短縮時間と救命率の向上率及び人口を用いた検証 [J] . 山田悟史, 吉川優矢, 大山智基, 日本建築学会计画系論文集 . 2013,第692期

机译：博士直升机操作效果的可视化和相关设施安排的规划研究：使用缩短开始医疗的时间进行验证，提高救生率和人口的方法
2. 多様化するモノ•ヒトのビッグデータに関する動向と解析ソリューション道路交通分野におけるビッグデータの短時間での効果的な解析の実現 [J] . 前田　真護, 藤井　琢哉道路 . 2019,第期

机译：多样化的事物与人类大数据相关的趋势和分析解决方案在短时间内实现对道路交通领域大数据的有效分析
3. 受信者主導型無線センサーネットワークにおける収集時間短縮のための転送負荷を考慮したビーコンスケジュールに関する一検討 [J] . 藤本章宏, 中野雄太, 吉廣卓也, 電子情報通信学会技術研究報告. ネットワ-クシステム. Network Systems . 2017,第459期

机译：考虑到接收者驱动无线传感器网络收集时间缩短的传输加载的信标日程表研究
4. 時間差を考慮に入れた時間-周波数領域でのブラインド信号源分離と位置の特定に関する研究: 断続的なノイズが混入された観測信号への適用と非圧縮データによる位置特定精度の向上について [C] . 鈴木　正則, 佐々木文夫, 上田　将吾, 日本建築学会大会 . 2008

机译：时差时频域盲分离与定位研究：间歇噪声在观测信号中的应用及无压缩数据定位精度的提高
5. アセチルコリンの冠注で誘発されるブタの主および小冠動脈攣縮モデルの開発とこのモデル動物を用いたニプラジロール, イソソルビド?ジニトレート, ブナゾシンの冠攣縮予防効果に関する研究 [D] . Kawamura, Atsushi 1991

机译：冠状动脉注入乙酰胆碱诱导的猪主，小冠状动脉痉挛模型的建立以及尼泊地洛尔，硝酸异山梨酯和布那唑嗪对模型动物的预防作用研究
6. 人工衛星で観測した夜間光をパラメータとするエネルギー消費の推定に関する研究 : Suomi NPPのDay/Night・Band(DNB)の感度評価とDMSP/OLS夜間データとの比較 [O] . 原政直, 澤向麻里絵, 胡斯勒図, 2014

机译：以卫星观测的夜灯为参数估算能耗的方法：Suomi NPP对日/夜频段（DNB）的灵敏度评估以及与DMSP / OLS夜间数据的比较

CPUとGPU間のデータ転送時間の短縮に関する研究

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅