並列言語XcalableMPのアクセラレータ向け言語拡張のOpenCL実装

概要

論文の詳細を見る
高い演算性能を持つ GPU や Intel MIC 等をアクセラレータデバイスとして汎用計算に用いる動きが HPC の分野で活発である,さらに,これらのアクセラレータを搭載したクラスタにおけるプログラミングも注目されている.しかし,アクセラレータを搭載したクラスタ上でプログラムを記述するためには,アクセラレータ専用の記述言語の他に,MPI に代表されるノード間通信インターフェースも用いる必要がある.このような分散並列環境におけるプログラミングの複雑さを解決する手段として,PC クラスタ向けの PGAS 言語である XcalableMP が開発されている.さらに,GPU を搭載したクラスタ向けに,CUDA を用いて XcalableMP の言語拡張も開発されている.本稿では,XcalableMP のアクセラレータ向け言語拡張を OpenCL で実装し,NVIDIA の GPU,AMD の GPU それぞれを搭載したマシンにおいて N 体問題と行列積を用いて評価を行った.その結果,元々 CUDA により実装されていた XcalableMP のアクセラレータ向け言語拡張と同等の性能が得られることを確認し,さらに,OpenCL 実装によって XcalableMP で記述したソースコードが異なる計算プラットフォーム間で可搬性を持つことを示した.
2012-03-19