動的タスクスケジューリングエンジンStarPUによるKIFMMの実装と性能評価
スポンサーリンク
概要
- 論文の詳細を見る
Fast Multipole Method (FMM) は, N 体問題のアルゴリズムで,近似計算により O(N) の計算量を実現する. FMM は,計算特性が異なり入力データによって負荷が変動する複数の計算ステップから構成される.本研究では,FMM の入力データ (粒子分布) による負荷変動に対して CPU/GPU 間の負荷分散を適切に行うことを目的とする.そのための手法として,動的タスクスケジューリングエンジンを採用し,そのためのライブラリである StarPU 上に Kernel Independent FMM (KIFMM) アプリケーションを実装し,性能を評価した.この実装を,入力データ毎の総当たりによって最適な静的スケジューリングを決定することができる実装と比較した.均一分散では単純なヒューリスティクスを 1 つ導入することにより静的スケジューリング実装に対して 137.9% ,球表面 (不均一) 分散においてはヒューリスティクスを用いずに同実装に対して 89.5% の性能を得た.このことから,動的タスクスケジューリングを用いることにより,最適な静的スケジューリング実装に対して競争的なパフォーマンスを発揮しつつ,入力データによる負荷変動に抗して負荷分散を実現することが可能であると言える.
- 2012-09-26
著者
関連論文
- 5K-7 情報爆発に対応するスケーラブルかつ自律的な障害解析(情報爆発時代における分散システム技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ソフトウェアECCによるGPUメモリの耐故障性の実現と評価(信頼性とセキュリティ,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- PCクラスタ向け故障発生器の設計と実装(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- OpenCLを用いた異種GPUにおける性能特性に応じた最適化
- OpenCLを用いた異種GPUにおける性能特性に応じた最適化
- GPU向け耐メモリエラーソフトウェアフレームワーク
- GPU向け耐メモリエラーソフトウェアフレームワーク
- CUDA GPU向けの自動最適化FFTライブラリ
- GPUにおける耐故障性を考慮した数値計算の電力性能
- ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク
- GPUにおけるモデルに基づいた電力効率の最適化
- ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク
- GPUにおけるモデルに基づいた電力効率の最適化
- 異種アクセラレータを持つヘテロ型スーパーコンピュータ上のLinpackの性能向上手法
- GPUクラスタを対象にした並列ステンシル計算の自動生成フレームワーク
- GPUクラスタを対象にした並列ステンシル計算の自動生成フレームワーク
- GPUにおける性能と消費電力の相関性の解析
- 性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ
- 仮想クラスタを用いた複数サイト上でのMPI実行環境(仮想クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 仮想クラスタを用いた複数サイト上でのMPI実行環境(仮想クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 空と宇宙に学ぶ/学生の挑戦 : 東京工業大学 Meister 人力飛行機部門の活動と課題
- 学生サークルにおける人力飛行機の安全確保について (第12回スカイスポーツシンポジウム講演集)
- GPU向け耐メモリエラーソフトウエアフレームワーク
- GPU向け耐メモリエラーソフトウエアフレームワーク
- 5K-3 情報爆発時代におけるモデルベース資源選択による高速な仮想クラスタ構築(情報爆発時代における分散システム技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 仮想クラスタ構築時間のモデリングおよびその最適化(ネットワーク)
- 1C21 横浜市における降水中の非海塩起源塩化物イオンの挙動(4) : 海塩の輸送と反応
- 1C20 横浜市における降水中の非海塩起源塩化物イオンの挙動(3) : 経年変化
- 1I07 横浜市における浮遊粒子状物質中の塩化物イオン成分の挙動(2)
- キャッシュを用いた仮想クラスタ高速構築手法の性能評価(仮想クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- キャッシュを用いた仮想クラスタ高速構築手法の性能評価(仮想クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 大規模分散システムにおける故障の解析(解析・省電力,SWoPP2006)
- CPU/GPUを共用したヘテロジニアス環境におけるFMMの最適化
- 動的タスクスケジューリングによるCPU/GPUヘテロジニアス環境でのFMMの最適化
- 動的タスクスケジューリングによるCPU/GPUヘテロジニアス環境でのFMMの最適化
- TSUBAME 2.0の全貌
- TSUBAME 2.0の全貌
- 動的タスクスケジューリングによるCPU/GPUヘテロジニアス環境でのFMMの最適化
- 動的タスクスケジューリングによるCPU/GPUヘテロジニアス環境でのFMMの最適化
- 動的タスクスケジューリングエンジンStarPUによるKIFMMの実装と性能評価
- システム評価のためのアプリケーション性能リポジトリの構築と性能モデルの評価
- CPU-GPUそれぞれに最適なデータレイアウトを選択可能にするOpenACCディレクティブ拡張
- 自動テンポラルブロッキングによる大規模ステンシル計算の実現