行列計算ライブラリインタフェースSILCの分散並列環境への実装(HPC-14 : 分散環境(2))
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,行列計算ライブラリを計算環境やプログラミング言語に依らない方法で利用するためのインタフェースSILC(Simple Interface for Library Collections)の分散並列環境向けの設計および実装方法について述べる.本システムを利用することで,MPIベースの行列計算ライブラリを分散並列プログラムからだけでなく逐次プログラムからも利用できる.SILCを用いるユーザプログラムには特定のライブラリや計算環境に依存したコードは現れないため,ユーザプログラムを書き換えることなく容易に別のライブラリや計算環境を利用できる.2つの例題を用いた評価実験では,本システムを介してMPIベースの行列計算ライブラリを16プロセスで利尽したとき6.46倍から9.12倍の性能向上が得られた.
- 社団法人情報処理学会の論文
- 2006-07-31
著者
-
西田 晃
九州大学情報基盤研究開発センター
-
須田 礼仁
東京大学情報理工学系研究科
-
長谷川 秀彦
図.情.大学
-
長谷川 秀彦
筑波大学図書館
-
長谷川 秀彦
筑波大学図書館情報メディア研究科
-
長谷川 秀彦
筑波大学
-
梶山 民人
科学技術振興機構戦略的創造研究推進事業
-
額田 彰
科学技術振興機構戦略的創造研究推進事業
-
西田 晃
中央大学21世紀COEプログラム
-
額 田
東大 大学院情報理工学系研究科
-
須田 礼仁
東大
関連論文
- エアリード楽器の発音機構 : 流体と音の相互作用の解析 (オイラー方程式の数理 : 渦運動と音波150年)
- Scilab : 数値計算のためのフリーソフトウェア
- 21aEJ-5 圧縮性LESを用いた小型エアリード楽器の数値解析(21aEJ 圧縮性流体,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
- WebCT教材の作成を通じた大学生のグループ学習 (教育実践を指向した学習支援システム/一般)
- 自動チューニングのための数理基盤技術(数値計算のための自動チューニング)
- 21aEJ-3 3次元LESによるオカリナの発音機構の解明(21aEJ 圧縮性流体,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 28pQC-6 圧縮性LESを用いた小型エアリード楽器の数値解析(渦運動・波動・その他,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- Dutt-Rokhlinの不等間隔高速順フーリエ変換の数値的研究
- 二重フーリエ級数展開を用いた球面上の浅水方程式の高速解法
- 自然勾配学習法の有効性
- Multi-Master Divisible Loadスケジューリングの最適化と漸近性能(最適化・高速化)
- 高速球面調和関数変換法の誤差の解析と制御
- 128.跳躍選手のスポーツ障害第1報 : 大学生と高校生の比較 : 運動生理学的研究II
- A-028 自己拡張可能な構文解析器生成系における構文解析手法の選択機能の実現(A分野:モデル・アルゴリズム・プログラミング)
- 圧縮性LESを用いたエアリード楽器の発音機構の数値解析 (数値解析と数値計算アルゴリズムの最近の展開--RIMS研究集会報告集)
- 演算精度をかえれば見えてくる線形方程式の世界
- 高速な4倍精度演算を用いたクリロフ部分空間法の安定化
- ソフトウェア
- 行列計算ライブラリインタフェースSILCの分散並列環境への実装(HPC-14 : 分散環境(2))
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 共有メモリ型並列計算機上の行列計算に対する並列化手法の性能評価(並列処理アルゴリズムと評価)
- 共有メモリ型並列計算機におけるLAPACKの性能評価
- 共有メモリ型並列計算機向け線形演算ライブラリにおける並列化手法の評価
- SOR法を用いた可変的前処理付き一般化共役残差法
- GCR法に対する可変的前処理法の性能評価 (偏微分方程式の数値解法とその周辺II)
- テネシー大学計算機科学科
- C-2. 研究におけるコンピュータの利用環境の向上
- テネシー大学におけるHigh Performance Computing
- テネシー大学計算機科学科(CS. UTK. EDU)紹介(海外情報)
- 第4巻第2号発行にあたって
- ベクトル計算機におけるFill-in付き(M)ICCG法の性能評価
- 連立一次方程式の標準解法
- 対称正定値疎行列の条件数概算法
- 圧縮性LESを用いたエアリード楽器の発音機構の数値解析 (数値解析と数値計算アルゴリズムの最近の展開)
- LESを用いた2次元および3次元エッジトーンの数値解析
- 大規模素因数分解のための高性能計算環境の実現(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 大規模素因数分解のための高性能計算環境の実現(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- オフライン自動チューニングの数理手法
- 疎行列固有値解法における4倍精度演算とその性能評価
- 疎行列固有値解法における4倍精度演算とその性能評価
- 大規模並列環境における疎行列固有値解法の性能予測
- 反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化
- OpenMPを用いた帯行列に対する直接解法の並列化(数値計算)
- 非対称行列から生成された対称行列に対するCG法 (数値解析と新しい情報技術)
- 並列非線型共役勾配法アルゴリズムとその性能評価
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 前処理付固有値解法の誤差評価
- 前処理付固有値解法の誤差評価
- 疎行列固有値解法における前処理の特性について(数値計算IV)
- 並列線形計算ライブラリLis上への固有値解法群の実装と特性評価(HPC-9:数値計算II,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 線形計算ライブラリを用いた共役勾配法系固有値解法の設計と実装(HPC-9 : 数値解析II)
- GF(2)上巨大疎行列に対する共役勾配法の適用と評価(HPC-16 : 数値計算)
- 並列ソフトウェアのオンライン自動チューニングのためのBayes的手法
- 6K-3 並列実験による疎行列格納法のオンライン自動チューニング(情報爆発時代における並列分散処理技術,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 線形方程式求解アルゴリズムの実行データに対するクラスタリング技術の一適用
- とびらの言葉
- 3.ソフトウェア自動チューニングの数理(ソフトウェア自動チューニングを支える基盤,科学技術計算におけるソフトウェア自動チューニング)
- 頑健で効率的なオンライン自動チューニングのための統計モデル(HPC-7:自動チューニングII,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 統計的パターン認識手法によるソフトウェア自動チューニングのための実験計画(HPC-3:自動チューニングI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ヘテロ並列計算環境における性能指標(並列化と高速化)
- オンライン自動チューニングのためのBayes逐次実験計画の解析モデルによる性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- オンライン自動チューニングのためのBayes逐次実験計画の解析モデルによる性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 自動チューニングにおける実験計画的手法を考慮した性能評価データ収集器の設計と実装(HPC-12 : 自動チューニングII)
- 並列・分散処理のためのスケジューリング理論(超ロバスト計算原理とモデリング・シミュレーション)
- Multi-master divisible loadの漸近最適スケジューリングの実機への実装(HPC-3: 科学技術計算)
- Multi-master divisible loadモデルに対する漸近最適スケジューリングの評価(ヘテロ型クラスタ)
- マルチクラスタ環境でのMMDL漸近最適スケジューリング(HPC-5 : 科学技術計算)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 高速球面調和関数変換ルーチン FLTSS(高性能計算及び一般)
- 実行時自動チューニングのための逐次実験計画 : 分散が共通な2つの正規分布の場合(Session 2:最適化)
- 高帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価(分散共有メモリと通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 高帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価(分散共有メモリと通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- InfiniBandクラスタを用いた疎行列線形代数演算ライブラリの効率的な実装技術(HPC-6: 高速ネットワークとその応用)
- 実空間法の特性について
- GPGPUにおけるデータ転送とカーネル実行のヒューリスティックスケジューリング
- 自動チューニング数理基盤ライブラリATMathCoreLib
- ヘテロ並列計算環境のためのタスクスケジューリング手法のサーベイ(サーベイ)
- 汎用的なソフトウェア自動チューニング機構のための実験計画法の応用の検討(HPC-11 : 自動チューニング)
- 2次元および3次元モデルを用いたエッジトーンの数値解析 (オイラー方程式の数理 : 力学と変分原理250年)
- 時間方向並列化の線形計算への適用可能性
- 知恵と勇気と自動チューニング
- 有限サイズのmulti-master divisible load問題に対する再分散スケジューリングアルゴリズム(負荷分散,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 有限サイズのmulti-master divisible load問題に対する再分散スケジューリングアルゴリズム(負荷分散, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- ヘテロ型クラスタのための2次元列ベース分割における通信スケジューリングと分割の最適化(ヘテロ型クラスタ)
- Multi-master divisible load modelにおける漸近最適スケジューリング(スケジューリング)
- 高速直交関数変換ルーチンFXTPACKの球面調和関数変換における高性能実装と性能評価(数値計算)
- 2次元列ベース分割によるヘテロ型クラスタのためのLU分解(HPC-7: 並列数値計算ライブラリ)
- ERXPP-数値ライブラリにより並列計算性能を簡易かつ適応的に引き出す方式の提案(科学技術計算)
- 高速球面調和関数変換法の安定性制御
- 22pPSB-74 流体音に於ける移動境界問題 : 音源としての移動境界(22pPSB 領域11ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- k段飛ばし共役勾配法:通信を回避することで大規模並列計算で有効な対称正定値疎行列連立1次方程式の反復解法
- 3次元エアリード楽器の流体音源と発振特性 (オイラー方程式の数理 : カルマン渦列と非定常渦運動100年)
- GPUにおけるダイバージェンス削減による高速化手法
- 相関を利用した自動チューニング数理手法
- GPUとGPGPUの概要
- 1. GPUとGPGPUの概要(GPUとその応用)
- 自動チューニング : 数理的手法によるソフトウェア高性能化 (次世代計算科学の基盤技術とその展開)