配列整合解析に基づく自動データ分割手法
スポンサーリンク
概要
- 論文の詳細を見る
大規模な分散メモリ型計算機向けにプログラムを並列化する際に,HPF などの並列プログラミング言語を用いることでプロセス間のデータ通信などを含む並列プログラムを自動的に生成することがが可能となってきた.しかしながら,HPF などでプログラムを記述するには,プログラマが配列変数などの分割を決定して手動で記述する必要がある.本論文では,このデータ分割を自動的に決定するための新たな配列整合解析手法を提案する.従来のデータ分割決定手法としては,Component Affinity Graph (CAG) と呼ばれるグラフを用いた複数の配列の次元間の関係を解析する手法が提案されているが,提案手法では,多重ループにおける多次元配列の参照関係を,ループの並列性を考慮しながら解析することで,より的確なデータ分割を求めることを可能とする.本手法を用いて NPB 3.2-SER BT ベンチマークのデータ分割を解析して HPF ディレクティブが挿入された Fortran プログラムを生成することが可能となった.生成された HPF プログラムを商用の HPF コンパイラを用いて並列化して PC クラスタで実行したところ,NPB3.0-HPF と同様の台数効果が得られた.
- 2010-03-10
著者
-
窪田 昌史
広島市立大学情報科学部
-
窪田 昌史
広島市立大学
-
北村 俊明
広島市立大学大学院情報科学研究科
-
北村 俊明
広島市立大学
-
北村俊明
広島市立大学情報科学研究科
-
北村 俊明
広島市立大学情報科学部情報工学科
関連論文
- プログラム保護を行うプロセッサの公開鍵暗号ハードウェアの評価(セキュアシステムとスケジューラ)
- 公開鍵暗号を用いてプログラムの保護を行うプロセッサの提案(プロセッサアーキテクチャ)
- 公開鍵暗号を用いてプログラムの保護を行うプロセッサの開発(一般セッションB プロセッサ・アーキテクチャII)
- ディジットシリアル浮動小数点演算器を用いた高精度FFT回路の設計検討(一般セッションC 設計と実装)
- キャンパスネットワークへの認証システムの導入(セッション2)
- BK-1-3 広帯域ネットワークを用いた大学間授業コラボレーションの実践(BK-1. JGN2の研究開発成果と次世代インターネットへの展開,ソサイエティ特別企画,ソサイエティ企画)
- MPIプログラムの自律チェックポインティング方式の実現(HPC-3 : スケジューリング)
- 構造化プログラムに対する静的単一代入形式の生成アルゴリズム
- 動的リンクライブラリを用いた実行時最適化の評価
- 2000-HPC-82-21 Javaクラスファイルの実行時ループ最適化手法
- 2000-HPC-82-18 ウェーブフロント型計算における性能予測モデルの構築
- 実行時情報を用いた性能最適化手法
- 並列化コンパイラTINPARにおける自動データ分割決定手法
- 非均質環境向け並列化コンパイラhetero-TINPER : 動的負荷分散方式の改良
- 並列化コンパイラTINPARによる非均質計算環境向けコード生成手法
- 並列化コンパイラTINPARにおける重複プロセッサ間通信の削減手法
- 並列化コンパイラTINPARにおける自動データ分割部の実現
- 不規則問題に対する並列化コンパイル手法
- 並列化コンパイラTINPARにおけるスカラ変数処理
- 不規則アクセスを伴うループの並列化コンパイル技法 : Inspector/Executorアルゴリズムの高速化
- 精度低下検出を行う浮動小数点演算器の検討と評価
- 学究活動に不可欠になったキャンパスネットワーク構築の一事例
- 学究活動に不可欠になったキャンパスネットワーク構築の一事例
- 配列整合解析に基づく自動データ分割手法
- 可変パイプラインを用いた低消費エネルギープロセッサの設計と評価(プロセッサ・アーキテクチャ)
- 可変パイプライン手法によるプロトタイプ低消費エネルギープロセッサの設計(CPSY-5 マイクロアーキテクチャ)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 京都大学学術情報メディアセンターにおけるメールシステムの運用
- Virtual Machineを活用した大規模ファイルシステム
- アクセラレータを用いたルジャンドル変換の高速化
- アクセラレータを用いたルジャンドル変換の高速化
- 異種命令セット同時実行プロセッサの設計と評価
- HPC向けVMスケジューラの改良の提案
- 精度低下検出を行う浮動小数点演算器の検討と評価 (集積回路)
- HPC向けVMスケジューラの改良の提案
- MPLDアーキテクチャのための配置配線支援ツール(ツール)
- 異種命令セット同時実行プロセッサの実装に向けた評価(プロセッサアーキテクチャ)
- 数値処理ライブラリを使用するプログラムの処理内容の「可視化」(HPC-6 : 開発・実行環境)
- MatlabMPI-to-MPIトランスレータの開発(HPC-3 : スケジューリング)
- 異種命令セット同時実行プロセッサOROCHIの構成(プロセッサアーキテクチャ)
- MATLABプログラムの実行時特殊化機能の実現(Session 2:最適化)
- 行列計算のためのMATLABベース静的型付け言語の設計と実装
- MATLAB記述に基づくPSBLASを用いた並列疎行列計算コードの生成(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- MATLAB記述に基づくPSBLASを用いた並列疎行列計算コードの生成(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 組み込みプロセッサを用いた動体検出システムの構築と評価(ARC-2: セキュア・アーキテクチャと組み込みプロセッサ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 行列言語コンパイラCMCのJDS形式への対応とMatrix Marketを用いた評価(数値計算アルゴリズム(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 行列言語コンパイラCMCのJDS形式への対応と Matrix Market を用いた評価
- 高速なMEX-Fileを生成できるMATLABコンパイラ(一般講演2)
- 距離画像生成処理におけるメディアプロセッサの評価(メディアプロセッサ)
- ステレオ画像処理を用いた曖昧再利用の評価(画像処理における再利用)
- 関数値再利用および並列事前実行による高速化技術
- RC-007 プログラム保護を行なうプロセッサの保護能力評価と改良(C分野:ハードウェア・アーキテクチャ,査読付き論文)
- 論理設計検証テストプログラム生成ツールの開発と評価方式
- 行列言語コンパイラCMCのJDS形式への対応とMatrix Marketを用いた評価(数値計算アルゴリズム(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 曖昧再利用によるステレオ画像処理の高速化
- 計算精度低下を検出するPCエミュレータの開発
- 計算精度低下を検出するPCエミュレータの開発
- 計算精度低下を検出するPCエミュレータの開発
- 計算精度低下を検出するPCエミュレータの開発
- 低電力Javeプロセッサのための投機的クロック制御
- マイクロプログラム制御計算機QA-1による直接実行型高級言語計算機の構成とその問題適応化方式
- 異種命令セットアーキテクチャをもつ高電力効率SMTプロセッサの開発(システム開発論文,計算機システム)
- アーキテクチャレベルシミュレータにおける消費電力推定の研究(評価,集積回路とアーキテクチャの協創〜ノーマリオフコンピューティングによる低消費電力化への挑戦〜)
- 曖昧再利用によるステレオ画像処理の高速化
- 異種命令セットアーキテクチャをもつ高電力効率SMTプロセッサの開発
- アーキテクチャレベルシミュレータにおける消費電力推定の研究
- 書き換え規則に基づく API ベース言語拡張のための COINS を用いたフレームワークの設計と実装
- Flash SSDにおける記憶管理方式の評価(メモリ・ストレージ,クラウド、ネットワーク及び一般)
- APIを用いた言語拡張のためのCOINSを用いた処理系実装の試み(アルゴリズムと言語処理系)
- RC-008 HPCクラウドにおける仮想計算機の割込み通知機構の改良(FIT論文賞受賞論文,C分野:ハードウェア・アーキテクチャ,査読付き論文)
- 書き換え規則に基づくAPIベース言語拡張のためのCOINSを用いたフレームワークの設計と実装