共有メモリマルチプロセッサシステム上での粗粒度タスク並列実現手法の評価

概要

論文の詳細を見る
シングルチップマルチプロセッサから, ハイパフオーマンスコンピュータまでの幅広いマルチプロセッサシステムにおいて, ループ並列性の限界を越えた性能を得るために, 粗粒度タスク並列処理の利用が重要となっている.また, プロセッサとメモリアクセス速度の差が大きくなっており, プロセッサに近接した共有メモリを有効に利用するためのデータローカリティの最適化も重要性を増している.本論文では, FORTRANプログラムを粗粒度タスクに分割し, タスク間の制御・データ依存を考慮した並列性を解析し, タスクをプロセッサに割り当てて並列実行させる粗粒度タスク並列処理手法, および粗粒度タスク並列処理の性能をさらに向上させるためのデータローカライゼーションを用いたキャッシュ最適化手法について述べる.本手法はOSCARマルチグレインコンパイラに実装されており, OpenMP Backendを用いることによって, 本コンパイラは逐次FORTRANから, SMP上での標準APIであるOpenMPを用いて粗粒度タスク並列処理を実現する並列化FORTRANプログラムを自動生成する.本論文ではOSCAR FOTRAN Compilerを用いてOpenMP FORTRANプログラムを自動生成して, IBM RS6000 SP High Node上で, 本手法の性能評価を行なった.性能評価ではSPEC95fpのswim, mgirdにおいて, OSCARコンパイラにより, IBM XL FORTRANコンパイラversion6.1の自動並列化に対して, 最大約2倍の速度向上率が得られることが確かめられた.
一般社団法人情報処理学会の論文
2001-01-26

共有メモリマルチプロセッサシステム上での粗粒度タスク並列実現手法の評価

スポンサーリンク

概要

著者

関連論文

スポンサーリンク