コンパイル時未定義ループ不変値を添字式に持つループの最内ループ並列化の1手法
スポンサーリンク
概要
- 論文の詳細を見る
データ並列言語の典型的なSPMDコード生成では、ループのインデックス空間をowner computes規則に基づいて分割するコードが生成される。コンパイラによる最適化として、分割された計算に必要なデータを可能な限り外側ループあるいはループの外でプリフェッチさせることで、より多くの計算を同期的通信なしに実行するコードを生成することがあげられる。また同期的通信によって、pipelined computationなどSPMDコードの並列実行様式が決定される。元のプログラムの意味を壊さずにプリフェッチを行なってプログラムをゆるい同期の下に並列に実行するためにはデータのdef-useの関係を調べることが必要である。そのためにコンパイル時のデータ依存解析が重要である。プリフェッチするデータをどのプロセッサが所有し、それら所有プロセッサが定義するどの時点の値を読み込むのかを解析する。しかしデータ依存解析によってある配列参照についてデータ依存が複数の可能性を持つと判明した場合、その配列参照の値を定義するステートメントが1つに決まらない。そのため、データ依存のdef-use関係に基づいた単純なメッセージベクタ化ができない。SPMDプログラムは1つのプログラムが全プロセッサで使用されるため、プロセッサごとの場合分けコードを挿入するとコードが増大し易い。詳細な場合分けによる最適化は、コードサイズを爆発させる可能性が大きい。そのためコードを大幅に増やさずに並列性を引き出す手法が現実的である。本稿では、コードを大幅には増やさずに、複数のデータ依存可能性を伴う最内ループが持つ並列性を引き出す手法を提案する。
- 1994-09-20
著者
-
小松 秀昭
日本アイ・ビー・エム株式会社東京基礎研究所
-
小松 秀昭
日本アイ・ビー・エム株式会社 東京基礎研究所
-
小笠原 武史
日本アイ・ビー・エム(株)東京基礎研究所
-
小笠原 武史
日本アイ・ビー・エム東京基礎研究所
関連論文
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法 (ディペンダブルコンピューティング)
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法 (コンピュータシステム)
- ループパーティショニングを用いたショートベクトル化技法
- 6N-4 レジスタ干渉グラフの分割による高速化手法に関する研究(数値計算とコンパイラ技術,学生セッション,アーキテクチャ)
- 非再試行型レジスタ割付けとその評価
- 生存区間分割時に発生する偽干渉を避けるための同時コピー中間コードの利用(ARC-6 : ソフトウェア最適化,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 分岐の相関を利用した効率的なパスプロファイリング
- 並列トランザクショナルアプリケーションのためのプログラミングフレームワーク
- 浮動小数点演算の正確さに関する投機を用いたJavaの数値計算の高速化
- マルチコア・システムにおける SAP Java アプリケーション・サーバのスケーラビリティ性能比較
- 並列コピーの導入による生存区間分割手法の性能向上
- Javaにおける例外処理の実行時情報を利用した最適化
- コンパイル速度の向上を目的とした非反復型レジスタ割付け手法
- 頻出メソッド管理テーブルを用いたinvokeinterface命令の実行高速化手法
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法
- SIMD命令を用いるUTF-8文字列デコード処理の高速化
- 再現コンパイル手法を用いたJava JITコンパイラの問題判別
- PowerPCプロセッサの特性を考慮した高速Javaバイトコードインタプリタの構成法
- 動的コンパイラのための実行時分岐予測を用いた最適化手法
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法
- ECUソフトウェアのシミュレーション実行時における状態方程式の遷移解析手法
- VMX命令セットを用いる高速なソートアルゴリズム(数値アルゴリズム)
- ポータブルなPrologコンパイラーの実現
- JSIAIワークステーション(7) : Prologコンパイラの評価
- JSIAIワークステーション(6) : Prologコンパイラの最適化技法
- JSIAIワークステーション(5) : Prologコンパイラの概要と設計方針
- プログラムの信頼性向上を目的とした補助スレッドの効率的利用(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- プログラムの信頼性向上を目的とした補助スレッドの効率的利用(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- レジスタ生存グラフを用いたレジスタ割付けへのプロセッサ並列度の考慮
- B-001 補助スレッドによるソフトウェアの信頼性向上(B.ソフトウェア)
- 領域分割レジスタ生存グラフを用いたレジスタ割付けへの動的計画法の適用
- C-13 レジスタの有効利用を考慮した部分冗長性除去(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- Java Just-In-Timeコンパイラにおける最適化とその評価
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成 (ディペンダブルコンピューティング)
- SILSを対象としたMCUペリフェラルプログラムの自動コード生成 (コンピュータシステム)
- 静的プロファイルを用いたファイル・プリフェッチ手法の提案
- HPF処理系の実現と評価
- ワークステーション・クラスタにおける動的なデータ交信/実行管理方法
- コード書換えによる動的メソッド呼び出しの直接Devirtualization
- Javaプログラムにおいて例外による順序制約を投機的命令移動を用いて除去する方法
- コード書換えによる動的メソッド呼び出しの直接devirtualization
- 分散メモリ並列計算機のためのコンパイラによる通信遅延隠蔽アルゴリズム
- 3. SP2のためのHPFコンパイラにおける最適化技術 (>特集
- HPFにおける実行時の通信解析オーバヘッドの削減手法
- HPFコンパイラにおける並列化手法
- 分散並列計算機のための並列性抽出法
- 動的コンパイラにおける実行時経路情報の構造的収集手法の提案
- 大域的なコード移動を使った複数式の実行コスト削減法
- Java言語に対する投機的なメモリアクセスの最適化手法
- 冗長な符号拡張命令の除去手法
- Java言語に対する効果的なNullチェックの最適化手法
- 命令レベル並列アーキテクチャのためのループアンローリングおよびソフトウェアパイプライニング適用技法
- コンパイル時未定義ループ不変値を添字式に持つループの最内ループ並列化の1手法
- 細粒度並列計算機NLITHの実現とその評価
- 細粒度並列計算機NLITHの概要
- バイトコードパターンマッチによるJavaインタプリタの高速化手法
- データ並列言語における集団通信の実行時認識手法
- データ依存不確定ループの最内ループ並列化
- データ依存不確定ループの最内ループ並列化
- 依存グラフを用いてアーキテクチャ独立な最適化と対象計算機の資源制約を調整する手法
- 非常に偏った条件分岐が存在するプログラムのデータフロー最適化
- 実行環境が異なる2つのコード間の遷移を行う際の効果的な最適化手法
- 命令レベル並列計算機上で並列実行する領域の選択を高速に行う方法