動的タスクスケジューリングによるCPU/GPUヘテロジニアス環境でのFMMの最適化
スポンサーリンク
概要
- 論文の詳細を見る
FMM は、N 体問題を O(N) 時間で近似的に計算するアルゴリズムであり、他の N 体問題のアルゴリズムと比較してスケーラブルであることから近年着目されている.一方で,FMM は異なる計算特性や依存性を持つ複数の計算フェーズからなるアルゴリズムであり、それらを複数の異種プロセッサを持つ環境上で効率よく実行する方法は明らかではない.本稿では、筆者らの過去の発表18) に引き続き、FMM の実装である kifmm3d の複数のフェーズを GPU 化し、速度向上と実装上の課題について検討した.さらにそれらの実装を元に、動的タスクスケジューリングシステムである StarPU5) を用いて CPU/GPU からなるヘテロジニアス環境上でプロセッサ資源を有効に利用する試みの初期実装および検討を行い,CUDA スレッドの起動や速度に関する不具合,フェーズ分割および filter の実装に関する検討事項など,様々な技術的問題点や検討事項に関する知見を得た.
- 2011-11-21
著者
関連論文
- 5K-7 情報爆発に対応するスケーラブルかつ自律的な障害解析(情報爆発時代における分散システム技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ヘテロ並列環境のための省電力タスクスケジューリング(並列計算,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- ソフトウェアECCによるGPUメモリの耐故障性の実現と評価(信頼性とセキュリティ,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 複数GPUにおけるセルフスケジューリングによる並列数値演算(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 大規模計算環境におけるユーザ満足度を考慮した資源管理へむけて(並列処理環境,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- スワップコストの動的推定によるメモリの省電力化手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ポータビリティの高いジョブスケジューリングシステム設計と実装(HPC-10 : ネットワークとスケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 仮想クラスタを用いたData-Intensive Application実行環境の性能モデル構築と最適化(HPC-2:仮想クラスタ,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Access Gridの構築とGrid上での国際会議
- ヘテロ型スーパコンピュータTSUBAMEのLinpackによる性能評価(高性能計算)
- 情報爆発時代に向けた新しいIT基盤技術の研究(情報爆発時代に向けた新しいIT基盤技術の研究)
- ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価(HPC-3 : 大規模運用システム(1))
- 次世代光インターコネクトでのMPI通信に関する研究
- プロセス間共通メモリイメージを考慮したマイグレーション最適化(並列/分散コンピューティング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 1 アクセラレータ技術の影と光 : ペタ〜エクサの次世代HPCの中心的な躍進技術へ(アクセラレータ,再び-スパコン化の切り札-)
- 3.情報爆発は情報システムをも「爆発」させる(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- NAREGIグリッドミドルウェアによる大規模連携接続実証実験(OS-6:分散システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 広域分散ファイルシステムにおけるアクセスパターンと性能を考慮したファイル配置(HPC-13:ファイルシステム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 5K-4 情報爆発時代のグリッドファイルシステム上での大規模データ管理(情報爆発時代における分散システム技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 広域分散環境における大規模データ管理のためのノードグルーピング(HPC-7 : データ管理)
- NAREGIミドルウェアβ-gLite間における相互ジョブ起動実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム
- レプリカ交換分子動力学シミュレータREMD Toolkitのグリッド上での実行(HPC-3 : 科学技術計算)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- MPC++-on-MPIのコモディティクラスタ環境における評価
- ORE Grid : 仮想計算機を用いたグリッド実行環境の高速な配置ツール(グリッド)
- カスタマイズ可能な仮想計算機上におけるグリッドでのジョブ実行(仮想計算機とクラスタ技術, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- Jojoによる遺伝的プログラミングの並列化(グリッド応用)
- Javaによる階層型グリッド環境Jojoの設計と実装(グリッド基盤ソフト)
- グリッド向け実行環境Jojoを用いた遺伝的アルゴリズムによる蛋白質構造決定
- グリッド環境に適したJava用階層型実行環境Jojoの設計と実装(高性能計算及び一般)
- Omni/SCASHにおける性能不均質なクラスタ向け動的負荷分散機能の実装と評価(HPC-3 : クラスタソフトウェア)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- Omni/SCASHにおける実行時性能評価に基づく動的負荷分散拡張の実装と評価
- ソフトウェア分散共有メモリ上のOpenMP Omni/SCASHのSPLASH2による性能評価
- グリッドチャレンジテストベッドの構築と運用 : グリチャレテストベッドの作り方(HPC-3 : 大規模運用システム(1))
- OGSAアーキテクチャに基づくNAREGIスーパースケジューラの設計と実装(グリッド)
- グリッド環境におけるスーパースケジューラ連携手法の検討(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- グリッド環境におけるスーパースケジューラ連携手法の検討
- 6K-3 情報爆発に対応する耐故障性MPIフレームワークの提案(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークCuckoo FTMPIの提案と評価(アーキテクチャ,SWoPP2006)
- ポータブルな耐故障性コンポーネントフレームワークを持つMPI実装に向けて(通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- ポータブルな耐故障性コンポーネントフレームワークを持つMPI実装に向けて
- 自律的な通信回復を行うFault Tolerant MPIの実装と評価(HPC-10 : クラスタソフトウェア)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 光ネットワークの補助的利用によるHPC性能向上(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- グリッド環境におけるMPI_Scatter/Gather通信アルゴリズムの最適化(HPC-1:MPI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 6K-5 情報爆発時代の光インターコネクト上でのMPI通信アルゴリズム(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6K-4 情報爆発時代のグリッド環境に対応したMPI集団通信アルゴリズムの最適化(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6K-2 情報爆発時代へ向けた不均一アーキテクチャにおけるスーパーコンピューティング(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Sun Fire X4500とGfarmを用いた大規模ストレージの構築(グリッドI)
- TSUBAMEの1年
- High-performance distributed solar computing (?): towards a grid that computes like trees (ハイパフォーマンスコンピューティング)
- 次世代省電力メモリを用いた並列プログラムの省電力化の評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 次世代光インターコネクト上でのMPIアプリケーションの評価(HPC-11 : 通信I)
- CPUおよびGPUを併用するFFTライブラリの提案と評価(HPC-1 : 最適化)
- ICTは科学の発展に役立つのか? : 情報学A05班の挑戦(「情報学を創る」-科研プロジェクトがめざしたもの)
- グリッド環境におけるマルチレーンを用いたMPIコレクティブ通信アルゴリズム(グリッド)
- 情報爆発時代における安全・安心ITシステム基盤(情報爆発時代に向けた新しいIT基盤技術の研究)
- 情報爆発時代における安全・安心ITシステム基盤
- SANを用いた高性能コンピュータシステムの将来像と究極の姿(パネル討論,計算システムとファイルシステム,SANを用いた高性能コンピュータシステム,及び一般)
- TSUBAMEの飛翔(Extended Abstract)(計算システムとファイルシステム,SANを用いた高性能コンピュータシステム,及び一般)
- PCクラスタにおける電力実行プロファイル情報を用いたDVS制御による電力性能の最適化(クラスタシステム)
- B-12-10 光バーストスイッチング技術のGridアプリケーションへの適用(B-12.フォトニックネットワーク,一般講演)
- 仮想計算機と仮想ネットワークを用いた仮想クラスタの構築
- TSUBAMEの飛翔 : ペタスケールへ向けた「みんなのスパコン」の構築(HPC-3 : 大規模運用システム(1))
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(ジョブスケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模環境向け情報共有手法を用いた分散ジョブスケジューリングシステム(ジョブスケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 光ネットワーク環境におけるMPI集団通信(分散共有メモリと通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- PCクラスタにおける電力実行プロファイル情報を用いたDVS制御による電力性能の最適化(省電力,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- グリッド上における仮想計算機を用いたジョブ実行環境構築システムの高速化(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模環境向け情報共有手法を用いた分散ジョブスケジューリングシステム(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 光ネットワーク環境におけるMPI集団通信(分散共有メモリと通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- PCクラスタにおける電力実行プロファイル情報を用いたDVS制御による電力性能の最適化(省電力, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- グリッド上における仮想計算機を用いたジョブ実行環境構築システムの高速化(グリッド, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- Ninf-1/Ninf-Gを用いたNMR蛋白質立体構造決定のための遺伝アルゴリズムのグリッド化(グリッドアプリケーション)
- 高性能計算のための低電力・高密度クラスタMegaProto(HPCハードウェア)
- PCクラスタにおけるDVS制御による電力性能の最適化(ARC-3: 低電力アーキテクチャ1, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(応用システム, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- 更新やカスタマイズが可能なクラスタ設定のパッケージ化手法(仮想計算機とクラスタ技術, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- 仮想計算機を用いて負荷分散を行うMPI実行環境(仮想計算機とクラスタ技術, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- ユーザのステアリングを許すインタラクティブなジョブスケジューリングシステム(グリッド)
- 大学における情報化戦略と理工系情報学科の貢献
- 高性能計算のための低電力・高密度クラスタMegaProto(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 非対称ネットワークを隠蔽する高速通信インフラストラクチャの設計と実装(グリッド(2), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- グリッド環境におけるモニタリングシステムの自律的構成(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 高性能計算のための低電力・高密度クラスタ MegaProto
- 非対称ネットワークを隠蔽する高速通信インフラストラクチャの設計と実装
- グリッド環境におけるモニタリングシステムの自律的構成
- 耐故障性を重視したRPCシステムNinf-Cの設計と実装(グリッド)
- グリッド上のスケーラブルな並列レプリケーションフレームワーク(HPC-11 : グリッド(3))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- クラスタ設定のパッケージ化の設計と実装(HPC-3 : クラスタソフトウェア)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 我が国におけるグリッドコンピューティングプロジェクト(大規模計算機シミュレーション特集号)
- 光ネットワークによるグリッドの未来 : 光ネットワーク時代のグリッド((フォトニック)インターネット・フォトニックネットワークアプリケーション,一般)
- グリッド技術を用いた進化系統樹推定の並列化(グリッド応用)