リング型アレイアクセレータ向け演算ライブラリの実装と性能評価
スポンサーリンク
概要
- 論文の詳細を見る
我々は,科学技術演算や画像処理,3 次元シミュレーションなどの演算速度向上,消費電力低減の両立を目的として,各演算器とシングルポートメモリを組にした構造をリング接続した構成のリング型アレイアクセラレータを提案してきた.しかし,アプリケーション開発者が,リング型アレイアクセラレータを利用し所望の性能を引き出すためには,ハードウェア構造や専用命令セットの理解と相当のチューニングコストが必要となる.開発者がアクセラレータを利用する際の負担を軽減し,その性能を最大限に利用可能な環境を提供するために,我々はリング型アレイアクセラレータと共に,自動で専用命令を出力するコンパイラや,専用ライブラリを開発する必要がある.本論文では,リング型アレイアクセラレータ,専用ライブラリの構成方式,およびリング型アレイアクセラレータの性能を引き出すためのライブラリ実装におけるチューニング方式について述べる.性能測定シミュレータによりライブラリの実行時間を測定し,リング型アレイアクセラレータの演算性能とデータ転送性能が全体の実行性能に及ぼす影響を確認した.また,汎用 CPU によるプログラムの実行時間を測定し,ライブラリ実行時間と比較したところ,リング型アレイアクセラレータを利用する場合,実行時間を最大約 50% 削減可能であることを確認した.
- 2013-07-24