バルク回帰並列処理 : 依存のあるループの並列実行方式
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, ループ運搬依存を含むループの効率的な並列化手法を提案する.依存のあるループの並列化においては, ループ中で繰り返し実行される命令列(ループボディ)全体の計算処理をprefix計算における要素演算と見なしてアルゴリズム変換によって並列化する方法がある(回帰演算の並列化手法の適用).回帰演算の並列化手法は, pipeline法やdoacross法の適用が困難なループに対しても有効であるなどの特徴を持つが, その単純な適用は総計算量の大幅な増加を引き起こし, プロセッサ数が少ない並列計算機では必ずしも高速化につながらない.これに対し, 本論文で提案する手法は, 依存のあるループへの回帰演算の並列化手法の適用において「ループ運搬依存の量」に着目したループ変換を導入する.これにより並列化にともなう計算量の増加を抑え, 数台〜数十台程度のプロセッサから成る並列計算環境において効率の良い並列実行を可能にする.疎結合計算機やSMP計算機を用いた実測では, pipeline法やdoacross法が適用できないループに対してプロセッサ数に比例した高速化が可能であることが確かめられた.
- 一般社団法人情報処理学会の論文
- 2001-11-15
著者
関連論文
- 公開鍵暗号を用いてプログラムの保護を行うプロセッサの提案(プロセッサアーキテクチャ)
- 線形回帰演算の並列化手法の応用によるDOACROSSループの並列実行
- スーパーコンピュータ用拡張記憶の拡張主記憶としての高度利用
- 動的リンクライブラリを用いた実行時最適化の評価
- 2000-HPC-82-21 Javaクラスファイルの実行時ループ最適化手法
- 2000-HPC-82-18 ウェーブフロント型計算における性能予測モデルの構築
- 実行時情報を用いた性能最適化手法
- 並列化コンパイラTINPARにおける自動データ分割決定手法
- 分散トランザクションシステム IXI の設計と実現
- 適応型時刻印方式に基づく同時実行制御方式
- データベースオペレーティングシステム μOPT-Rにおける分散セグメンテーション方式
- 実時間オペレーティングシステムR^2/V2におけるタスクグループの実現
- オブジェクト指向オペレーティングシステム Ozone におけるプロセス管理方式
- 複数の並列化手法を統合する並列実行方式
- 分散オペレーティングシステムDM-2におけるメモリ管理部の実現
- 分散オペレーティングシステムDM-2におけるサイトの動的な追加及び切り離し方式
- 分散オペレーティングシステムDM-2におけるスレッドディストリビュータの実現
- 分散仮想記憶に基づくオペレーティングシステムDM-1におけるタスク・スレッドモデル
- 分散仮想記憶に基づくオペレーティングシステムDM-1の構成
- 微細テクノロジ向けDRCルールファイルからの設計規則抽出とその可視化(レイアウト設計検証, システムLSIの設計技術と設計自動化)
- FPAccAアーキテクチャへのラジオシティ法の実装と評価(FPGAとその応用及び一般)
- FPAccAアーキテクチャへのラジオシティ法の実装と評価(FPGAとその応用及び一般)
- FPAccAアーキテクチャへのラジオシティ法の実装と評価(FPGAとその応用及び一般)
- DRCルールファイルからの設計規則抽出とその可視化
- 兎・亀プロセッサの切替えによる低消費エネルギー化の提案(システムオンシリコン設計技術並びにこれを活用したVLSI)
- 兎・亀プロセッサの切替えによる低消費エネルギー化の提案(システムオンシリコン設計技術並びにこれを活用したVLSI)
- IEEE754準拠単精度浮動小数点除算器IPライブラリの開発
- IEEE754準拠単精度浮動小数点除算器IPライブラリの開発
- IEEE754準拠単精度浮動小数点除算器IPライブラリの開発
- DRCルールファイルからの設計規則抽出とその可視化
- DRCルールファイルからの設計規則抽出とその可視化
- DRCルールファイルからの設計規則抽出とその可視化
- 乗算器のBoothリコーダの回路方式について
- 乗算器のBoothリコーダの回路方式について
- 乗算器のBoothリコーダの回路方式について
- FPAccA model 2.0チップの設計 : 再構成可能な浮動小数点演算器アレイ
- FPAccA model 2.0チップの設計 : 再構成可能な浮動小数点演算器アレイ
- 一般二分決定グラフの生成法
- 一般二分決定グラフの生成法
- MPLDアーキテクチャのための配置配線支援ツール(ツール)
- ベクトル計算機に適したB-スプラインの計算法
- スプライン関数を用いた多次元データの平滑化 : ベクトル計算機向きの算法
- ベクトル計算機に適したB-スプラインの計算法(スーパーコンピュータのための数値計算アルゴリズムの研究)
- 超並列算計機におけるデータ並べ替えアルゴリズムと要求されるデータ転送能力の見積もり
- 異なる長さをもつ表形式データの転置
- 多階層記憶におけるデータ並べかえと記憶階層の最適化
- 数値処理ライブラリを使用するプログラムの処理内容の「可視化」(HPC-6 : 開発・実行環境)
- MatlabMPI-to-MPIトランスレータの開発(HPC-3 : スケジューリング)
- MATLABプログラムの実行時特殊化機能の実現(Session 2:最適化)
- 行列計算のためのMATLABベース静的型付け言語の設計と実装
- MATLAB記述に基づくPSBLASを用いた並列疎行列計算コードの生成(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- MATLAB記述に基づくPSBLASを用いた並列疎行列計算コードの生成(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 行列言語コンパイラCMCのJDS形式への対応とMatrix Marketを用いた評価(数値計算アルゴリズム(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 行列言語コンパイラCMCのJDS形式への対応と Matrix Market を用いた評価
- 高速なMEX-Fileを生成できるMATLABコンパイラ(一般講演2)
- 疎行列に対応した行列言語コンパイラCMCの開発(言語処理系)
- MATLAB記述のコンパイレーションにおける複数種類の疎行列データ構造への対応(スケジューリング)
- MATLABに基づく疎行列計算向けコード生成(科学技術計算)
- 実時間オペレーティングシステムR^2用マルチタスクシミュレータの開発R^2シミュレータの言語処理系
- 実時間オペレーティングシステムR^2用マルチタスクシミュレータの開発R^2シミュレータの機能と全体構成
- データベース専用オペレーティングシステムμOPT-Rの分散環境におけるセグメント管理方式
- データベース専用オペレーティングシステムμOPT-Rにおける演算処理方式について
- 再帰的手続きの自動ベクトル化における幅優先法の拡張
- FPAccA model 2.0チップの設計 : 再構成可能な浮動小数点演算器アレイ
- 実時間オペレーティングシステム R^2-86 核のアーキテクチャ
- 実時間オペレーティングシステムR^2-86の開発とその移植性
- 実時間オペレーティングシステムR^2のロボットプリミティブとプロトタイプシステム
- 一般二分決定グラフの生成法
- 線形回帰演算の並列化手法の応用によるDOACROSSループの並列実行
- ベクトル計算のための一次回帰演算の高速アルゴリズム
- 回帰的なデータ参照を伴う演算のベクトル化
- 自動ベクトル化コンパイラにおけるイディオム認識法
- 陽的差分による3次元電磁流体シミュレーションのスーパコンピューティング
- ベクトル計算機のための一次回帰演算の高速アルゴリズムとその並列化(並列処理)
- バルク回帰並列処理 : 依存のあるループの並列実行方式
- 粒子輸送モンテカルロシミュレーションコードの自動並列化
- 粒子輸送モンテカルロシミュレーションコードの自動並列化
- 疎結合並列計算機Paragonの性能評価 : ノード間通信性能の評価を中心に
- 実時間オペレーティングシステムR^2の入出力制御方式
- 実時間オペレーティングシステムR^2の通信管理方式
- 実時間オペレーティングシステムR^2のタスク管理方式
- 実時間オペレーティングシステムR^2の設計目標と全体構成
- 自動ベクトル化並列化コンパイラV-Pascal Ver.3
- 自動ベクトル化並列化コンパイラV-Pascal Ver.3
- 精密な依存解析のための変数値域の静的予測
- 分散メモリ型並列計算機用自動並列化コンパイラV-Pascal/DM
- 分散OS DM-1における障害対策のためのシステム停止機能
- 分散オペレーティングシステムDM-1におけるスレッド分配機構
- バス結合並列計算機モデルにおけるデータ転送の最適アルゴリズム
- 高並列計算機におけるデータ並べ替えの最適化
- バス結合型並列計算機におけるデータ転送の最適アルゴリズム(計算機構とアルゴリズム)
- バス結合マルチプロセッサ型ベクトル計算機における線形計算アルゴリズムの評価
- WHILE型ループの自動ベクトル化,並列化
- Logspace Bounded Alternation and Logical Query Programs
- 多重ループにわたる配列データ依存関係解析法
- 表示的意味論によるC言語の意味記述と処理系作成への応用
- 自動ベクトル化コンパイラのための制御関係解析法
- 電磁流体方程式における高速数値計算法と数値解の評価
- ベクトル計算機における拡張記憶の拡張主記憶としての仮想化
- 拡張記憶の拡張主記憶としての仮想化