レジスタスロットを考慮したSIMD向け細粒度自動並列化コンパイラ

概要

論文の詳細を見る
SIMD演算は,高いデータ並列性を持つ計算処理に対して有効であるが,それらを有効に利用するプログラムが必要となる.そのため,アセンブリ言語や特殊な関数を呼び出すように変更することが要求される.しかし,明らかなデータ並列性のあるプログラムを変更することは容易であるが,内在しているデータ並列性を活用するためには,注意深くプログラムを解析するか,あるいは,実装するアルゴリズムそのものを再設計する必要がある.これは,大変困難で,また時間のかかる作業であるため,コンパイラによって自動化されることが望まれている.本論文では,SIMD演算を手軽かつ効果的に活用するために,プログラム中に内在する並列性に着目した自動並列化手法を提案する.提案手法では,データを揃えるために必要となるShuffle命令を削減することで,少ないオーバヘッドで高い並列演算性能を引き出す.提案手法をCell B.E.のSPUを対象とする自動並列化に適用し,トイプログラムに対しては期待どおりの並列度を,またDSPStoneのプログラムに対しては,提案手法を適用しなかった場合と比べて1.565倍,gccおよびXL-Cでコンパイルした場合と比べ,最大1.529倍,1.715倍の実行速度の向上を実現した.
2008-08-21