Effect on Run-time Auto-tuning for the Multi-section with Multiple Eigenvalues Method
スポンサーリンク
概要
- 論文の詳細を見る
We present the Multi-section with Multiple Eigenvalues (MME) Method for finding eigenvalues of symmetric tridiagonal matrices, and show how to dynamically choose implementation parameters to optimize its performance. Performance results with the HITACHI SR8000 and SR11000 with 8 processors per node yield (1) up to 6.3x speedup over a conventional multi-section method, and (2) up to 1.47x speedup over a statically tuned MME method.
- 社団法人情報処理学会の論文
- 2006-07-31
著者
-
片桐 孝洋
東京大学情報基盤センター
-
KATAGIRI TAKAHIRO
Graduate School of Information Systems, The University of Electro-Communications
-
VOMEL CHRISTOF
Computer Science Division, University of California
-
DEMMEL JAMES
Computer Science Division, University of California
-
Vomel Christof
Computer Science Division University Of California
-
片桐 孝洋
東京大学情報基盤センタースーパーコンピューティング研究部門
-
Demmel James
Computer Science Division University Of California
関連論文
- SC09(学術会合報告)
- 「行列・固有値問題の解法とその応用」研究部会活動報告(研究部会だより)
- 相乗り通信を利用したソフトウェアDSMの通信回数削減手法(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 「数値計算のための自動チューニング」特集号に寄せて (特集 数値計算のための自動チューニング)
- 1.ソフトウェア自動チューニングの枠組み(概論,科学技術計算におけるソフトウェア自動チューニング)
- 「Cellスピードチャレンジ2008」実施報告(ARC-6:通信およびコンテスト報告,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ソフトウェア自動チューニングにおける標本点逐次追加型性能パラメータ推定法の疎行列計算への適用(数値計算)
- マルチコアプログラミングコンテスト「Cellスピードチャレンジ2007」実施報告(ARC-11 : シミュレータおよびコンテスト報告,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- Alphaアーキテクチャ用COINSマシン記述の実装とGCCとの比較
- ソフトウェア自動チューニングにおける標本点逐次追加型性能パラメータ推定法(数値計算,数理計画法)
- 通信量の密度に着目したS-DSM開発支援ツールS-CATの機能拡張(セッション2)
- ソフトウェアDSM MochaとMPIの並列ベンチマークを用いた性能評価(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 電力的制約を考慮した低消費電力指向最適化コンパイラ(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 量子i.i.d.状態における仮説検定の漸近特性に関する数値的アプローチ
- CPUとGPUを用いた並列GEMM演算の提案と実装(数値計算)
- MPIとの比較によるソフトウェアDSMの性能評価(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- Effect on Run-time Auto-tuning for the Multi-section with Multiple Eigenvalues Method
- 不均質なクラスタ環境を対象とするデータ再配置による動的負荷分散機構の設計と実装(会場A)
- Multi-section with Multiple Eigenvalues Method for Computing Eigenvalues in Symmetric Tridiagonal Eigensolvers(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- Multi-section with Multiple Eigenvalues Method for Computing Eigenvalues in Symmetric Tridiagonal Eigensolvers(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- S-DSMシステムにおけるページ要求時の受信通知を削減する方式(ソフトウェア分散共有メモリ)
- 「数値計算のための自動チューニング」特集号に寄せて(数値計算のための自動チューニング)
- SIAM CSE09(Conference Reports)
- 「行列・固有値問題の解法とその応用」研究部会活動報告
- マルチコア環境における自動チューニング機能付き疎行列反復解法ライブラリ
- 超並列マルチコア環境での自動チューニング機能の有効性 : T2Kオープンスパコン上の固有値ソルバを例にして(並列数値計算)
- Segmented Scan法のCUDA向け最適化実装
- OpenATLib:数値計算ライブラリ向け自動チューニングインタフェース
- ペタフロップス環境における小規模行列用対称密行列固有値ソルバに向けて-逆変換の改良
- Xabclib : 汎用的自動チューニングインターフェースOpenATLibを利用した反復解法ライブラリの開発(数値計算のための自動チューニング(続))
- 行列計算ライブラリ向け数値計算ポリシーインターフェースの提案
- 自動チューニングインターフェースOpenATLibにおける疎行列ベクトル積アルゴリズム
- OpenATLibを利用した疎行列ライブラリの開発と評価
- OpenATLib:汎用的な自動チューニングインターフェースの設計と実装
- ソフトウェアDSM MochaとMPIの並列ベンチマークを用いた性能評価(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 電力的制約を考慮した低消費電力指向最適化コンパイラ(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- CPUとGPUの並列処理による行列積和演算方式の提案(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- Bimode-Plus分岐予測器の提案(プロセッサアーキテクチャ)
- 3次元津波伝搬シミュレーションにおけるコード最適化一手法
- Segmented Scan 法のCUDA向け最適化実装
- 「Cellチャレンジ2009」実施報告
- 「Cell チャレンジ2009」実施報告
- SIAM AN10(Conference Reports)
- マルチコアプロセッサにおけるリオーダリング付き非構造格子向け前処理付反復法の性能
- Windowsクラスタにおける疎行列反復解法ソルバの自動チューニング(HPC-3:自動チューニングI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 自動チューニングインターフェース OpenATLib における疎行列ベクトル積アルゴリズム
- 2008年度年会「若手研究者による学会への期待」報告
- Supercomputing 08(Conference Reports)
- 編集にあたって(科学技術計算におけるソフトウェア自動チューニング)
- 4.ソフトウェア自動チューニング記述のための計算機言語(ソフトウェア自動チューニングを支える基盤,科学技術計算におけるソフトウェア自動チューニング)
- T2Kオープンスーパーコンピュータと共用イノベーション
- RAO-SS : Autopilotを用いた疎行列ソルバにおける実行時自動チューニング機構(数値計算アルゴリズム(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- RAO-SS : Autopilot を用いた疎行列ソルバにおける実行時自動チューニング機構
- SimCore/Alpha Functional Simulatorの設計と実装(VLSI設計支援システム, システム開発論文)
- とびらの言葉
- 疎行列反復解法ライブラリにおける自動チューニング機能の開発 (科学技術計算アルゴリズムの数理的基盤と展開)
- 自動チューニング処理記述言語ABCLibScript の組み込みシステムへの適用の一検討(HPC-12 : 自動チューニングII)
- 三次元有限要素法アプリケーションにおける行列生成処理のCUDA向け実装
- 疎行列-ベクトル積における実行時データ変換のための自動チューニング方式
- 三次元有限要素法アプリケーションのCUDA向け実装と性能評価
- 自動チューニングインターフェースOpenATLibにおける自動チューニング機能の評価
- HxABCLibScript:非均質計算機向け自動チューニング記述言語拡張
- 高精度行列-行列積アルゴリズムのスレッド並列化とABCLibScriptへの機能実装
- 大規模SMP並列スーパーコンピューター(HITACHI SR16000モデルM1)の性能評価
- 日本応用数理学会若手の会(研究部会だより)
- SC10参加報告
- SIAM CSE 11(学術会合報告)
- $ppOpen-AT$ : ポストペタスケール時代の数値シミュレーション基盤ソフトウェア$ppOpen-HPC$ のための自動チューニング基盤 (科学技術計算における理論と応用の新展開)
- 収束障害(Fault Convergence):数値計算ソフトウェアにおける新しい安全性の概念
- 量子i.i.d.状態の仮説検定に関する数値的手法とその誤差分析 (コンピューティングシステム Vol.4 No.4)
- レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーションと性能評価
- レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーションと性能評価
- BiCGStab法の前処理付きアルゴリズムに対する改善 (コンピューティングシステム Vol.5 No.3)