並列FMOプログラムOpenFMOの性能最適化
スポンサーリンク
概要
- 論文の詳細を見る
数万〜数 10 万並列での効率的な実行を目指して,並列フラグメント分子軌道プログラム OpenFMO の性能最適化を行った.その際に,FMO 計算のカーネルコードである分子積分計算の負荷均等化と,中間データであるモノマー密度行列データの保存,アクセス方法に注目して最適化を行った.その結果,分子積分計算の並列化効率向上と,モノマー密度行列へのアクセス性能向上を達成することができ,数万並列実行時での効率的な FMO 計算が可能になった.
- 2012-03-19
著者
-
小林 泰三
九州大学情報基盤研究開発センター
-
高見 利也
九州大学情報基盤研究開発センター
-
南里 豪志
九州大学
-
青柳 睦
九州大学情報基盤センター
-
稲富 雄一
九州大学
-
本田 宏明
九州大学
-
高見 利也
九大情基セ
-
小林 泰三
九州大学
-
高見 利也
京都大学理学部
-
真木 淳
九州大学情報基盤センター
-
青柳 睦
九州大学 情報基盤センター
-
稲富 雄一
九州大学情報基盤研究開発センター
-
眞木 淳
財団法人九州先端科学技術研究所
-
本田 宏明
九州先端科学技術研究所
-
小林 泰三
立命館大学物理学教室池田研究室
-
高見 利也
九州大学
-
眞木 淳
九州先端科学技術研究所
-
南 一生
理化学研究所
-
青柳 睦
九州大学
-
高見 利也
九大情報基盤セ
関連論文
- エアリード楽器の発音機構 : 流体と音の相互作用の解析 (オイラー方程式の数理 : 渦運動と音波150年)
- 4.大学間連携グリッド基盤の運用(e-サイエンスを実現するグリッド技術)
- 21aEJ-5 圧縮性LESを用いた小型エアリード楽器の数値解析(21aEJ 圧縮性流体,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 科学技術計算を対象とした大規模再構成可能データパスの性能評価(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 片側通信を用いた並列フラグメント分子軌道計算プログラムの実装(HPC-5 : アプリケーションI)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(オンチップ・ネットワーク,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- GridFMO : グリッド環境を用いた大規模量子化学計算(グリッド)
- OpenMP 入門(4) : マルチコアCPU時代の並列プログラミング
- OpenMP 入門(2) : マルチコアCPU時代の並列プログラミング
- OpenMP 入門(1) : マルチコアCPU時代の並列プログラミング
- Access Gridの構築とGrid上での国際会議
- 大規模システム評価環境PSI-SIM : 数千個のマルチコア・プロセッサを搭載したペタスケールコンピュータの性能予測(マルチコア設計開発/性能評価,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 大規模システム評価環境PSI-SIM : 数千個のマルチコア・プロセッサを搭載したペタスケールコンピュータの性能予測(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- 大規模分子の分子軌道計算 : Lysozyme とモデルDNA分子の分子軌道
- NAREGIグリッドミドルウェアによる大規模連携接続実証実験(OS-6:分散システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 21aEJ-3 3次元LESによるオカリナの発音機構の解明(21aEJ 圧縮性流体,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 28pQC-6 圧縮性LESを用いた小型エアリード楽器の数値解析(渦運動・波動・その他,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- マイクロ波環境と受動被曝 : 基礎物理の役割(最近の研究から)
- 大学間連携グリッド基盤の運用
- 27pQC-5 Kicked Rotor系の状態制御と遷移 : GPGPUによる量子ダイナミクス(量子カオス系・量子論基礎(その他の量子力学系を含む),領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- グリッドミドルウェアの階層的管理機構によるNAREGIインストーラの設計と実装(グリッド)
- 20aVB-8 楽器に於ける渦音の役割 : 流体と音波の連成計算による解析V(20aVB 流体一般(波動・複雑流体・シミュレーション手法等),領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 24aWF-7 楽器に於ける渦音の役割: 流体と音波の連成計算による解析III(圧縮性流体・複雑流体,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- 24aWF-8 楽器に於ける渦音の役割: 流体と音波の連成計算による解析IV(圧縮性流体・複雑流体,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- 21pTC-8 メディエイターを用いた連成計算によるマルチスケール現象の理解に向けて1(化学物理一般(光応答・電子状態・シミュレーション),領域12,ソフトマター物理,化学物理,生物物理)
- 18pWD-3 RISM/SCF達成計算による溶液中分子の一電子軌道の固有値統計と局在(量子力学・量子カオス,領域11,原子・分子,量子エレクトロニクス,放射線物理)
- 大規模固有値問題のmaster-worker型並列解法(数値計算)
- FMO-MO法による大規模分子軌道計算(数値シミュレーション)
- B-10-23 敷設済み伝送路を用いた光3R再生システムフィールド実験(B-10.光通信システムB(光通信),一般講演)
- 敷設済み光ケーブルを用いた光3R再生フィールド実験((フォトニック)IPネットワーク技術, (光)ノード技術, WDM技術, 一般)
- B-12-9 GMPLS制御された全光2R再生システムを適用した品質保証された40Gbit/s波長パスサービスフィールド実験(B-12. フォトニックネットワーク, 通信2)
- 圧縮性LESを用いたエアリード楽器の発音機構の数値解析 (数値解析と数値計算アルゴリズムの最近の展開--RIMS研究集会報告集)
- GMPLSマルチレイヤ相互連携システムを適用した動的な40Gbit/s波長パス切り替えフィールド実験((フォトニック)IPネットワーク技術, (光)ノード技術, 光バーストスイッチング技術, WDM技術, 一般)
- 圧縮性LESを用いたエアリード楽器の発音機構の数値解析 (数値解析と数値計算アルゴリズムの最近の展開)
- Partially Direct SCF 法の開発と性能評価
- GMPLSマルチレイヤ相互連携システムを適用した動的な40Gbit/s波長パス切り替えフィールド実験((フォトニック)IPネットワーク技術, (光)ノード技術, 光バーストスイッチング技術, WDM技術, 一般)
- LESを用いた2次元および3次元エッジトーンの数値解析
- フラグメント分子軌道法プログラムABINIT-MPにおける2電子積分ルーチンの高速化ならびに並列化と性能評価
- NSIM:将来の大規模相互結合網を対象とした通信シミュレータの開発
- 21aEH-3 Kicked Rotor系での非断熱遷移とSuperadiabatic Base(21aEH 量子論基礎・量子カオス系,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- FMO-MO 法による大規模分子軌道計算(計算科学の基盤技術とその発展)
- FMO-MO法における大規模分子軌道計算 : 解くべき固有値問題の特徴(行列・固有値問題における線形計算アルゴリズムとその応用)
- 通信と計算の負荷を考慮した並列疎行列ベクトル積の動的負荷分散技術
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PSI-NSIM : 大規模並列システムの性能解析に向けた並列相互結合網シミュレータ(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 次世代スーパーコンピュータの設計開発に向けたシステム性能評価環境PSI-SIM(HPC-16 : 性能評価)
- 大規模並列システムの性能評価を目的としたプログラムコード抽象化技法(HPC-3 : スケジューリング)
- Access Gridの構築とGrid上での国際会議
- 26pTE-7 量子カオス系の最適制御における汎関数のランドスケーブについて(26pTE 量子カオス系,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- Eric(二電子積分計算専用プロセッサ)LSIの開発
- 二電子積分計算専用プロセッサ・アーキテクチャの開発(高性能アーキテクチャ)
- 二電子積分計算専用プロセッサ・アーキテクチャ
- 二電子積分計算専用プロセッサ・アーキテクチャ
- Cellプロセッサへの分子軌道法プログラムの実装と評価(HPC-6 : 並列アプリケーション)
- 大規模分子軌道計算における解くべき固有値問題の特徴
- メッセージ通信ライブラリを用いたプログラムの並列化例と計算速度および計算精度の評価
- 24pPSB-48 コーヒードロップレットの変形と分離のダイナミクス(24pPSB 領域11ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 縮約ガウス関数にもとづく分子積分の計算法
- 9033 大規模固有値問題のグリッド環境向き並列解法(GS-D 一般セッション(行列計算))
- 分子軌道計算専用計算機用LSI(ERIC)の開発
- 分子軌道計算専用計算機のためのフォック行列並列計算アルゴリズムの開発
- チュートリアル OpenMP入門(3)マルチコアCPU時代の並列プログラミング
- 2電子積分計算ルーチンの性能評価
- 単一磁束量子回路による再構成可能な大規模データパスをもつプロセッサ(ディジタル・一般)
- パソコンクラスタによる分子の状態密度の並列計算
- 分子軌道計算向け専用プロセッサ(ERIC)の開発(回路技術(一般, 超高速・低電力・高機能を目指した新アーキテクチャ))
- 電磁波研究会の自己評価 : 一若手の呟き(第3回 電磁場と生体への影響-分子機構と総合評価の検討-)
- 一次データを保存しない大規模科学計算の可能性
- ヘテロジニアスな並列計算環境を応用した連成・連係計算の提案
- 広域分散環境を提供するHPCI先端ソフトウェア運用基盤の設計
- 2次元および3次元モデルを用いたエッジトーンの数値解析 (オイラー方程式の数理 : 力学と変分原理250年)
- 26pTE-7 多準位量子状態の最適制御と半古典極限(26pTE 量子カオス・量子論基礎(その他の量子力学系を含む),領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 28aPS-86 分子動力学データに対する統計解析(28aPS ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 時間方向並列化の線形計算への適用可能性
- MPI_Allreduceの「京」上での実装と評価
- MPI_Allreduceの「京」上での実装と評価
- 連成・連携計算によるデータ量削減の評価
- 連成・連携計算によるデータ量削減の評価
- 連成・連携計算によるデータ量削減の評価
- 連成・連携計算によるデータ量削減の評価
- MPI_Allreduceの「京」上での実装と評価
- MPI_Allreduceの「京」上での実装と評価
- 22pPSB-74 流体音に於ける移動境界問題 : 音源としての移動境界(22pPSB 領域11ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 23aGN-5 生体分子の分子動力学時系列データに対する統計解析(23aGN 生物物理,領域12(ソフトマター物理,化学物理,生物物理))
- 22pPSB-73 遅いダイナミクスにより生成される表面パターン(22pPSB 領域11ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 24aGT-4 カオス系の最適制御問題における量子古典対応(24aGT 量子カオス系,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 21pJF-10 分子階層モデルを使った生体分子の量子ダイナミクス(21pJF 化学物理,領域12(ソフトマター物理,化学物理,生物物理))
- 並列FMOプログラムOpenFMOの性能最適化
- 3次元エアリード楽器の流体音源と発振特性 (オイラー方程式の数理 : カルマン渦列と非定常渦運動100年)
- 異なるスカラアーキテクチャ(x86,SPARC64)の電磁流体コードによる性能評価
- MPI_Allreduceの「京」上での実装と評価
- 複雑量子系の最適制御理論
- 24pAE-8 粒子法による量子ダイナミクスの定式化と数値計算(24pAE 保存力学系・その他の力学系,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 25pPSA-65 流体音に於ける移動境界問題II(25pPSA 領域11ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 28aPS-87 流体音に於ける移動境界問題IV(領域11ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- CPUとDRAMの消費電力制限下でのMHDシミュレーションコードの電力特性