フラグメント分子軌道法に現れるFock行列計算のGPGPU化
スポンサーリンク
概要
- 論文の詳細を見る
OpenFMOプログラムのFock行列計算についてCUDAによるGPGPU化を行った.コストの高いアトミック加算についてはこれを回避するFock行列計算手法を提案し実装した.さらにスクリーニング過程の分離や動的負荷分散の実現,基底関数のソートなど多くの高速化の技法を実装することにより1CPUコアに対し13倍から22倍程度の性能を実現した.より高速なFock行列計算を目指し,MPIを利用した複数GPUによる並列化についての実装も行った.16台のGPUを利用した計算で4CPUコアに比べ40倍程度の性能が得られた.
- 2013-10-30
著者
-
朴 泰祐
筑波大学計算科学研究センター
-
塙 敏博
筑波大学計算科学研究センター
-
Hanawa T
筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター
-
庄司 光男
筑波大学計算科学研究センター
-
梅田 宏明
筑波大学計算科学研究センター
-
稲富 雄一
九州大学大学院システム情報科学研究院
関連論文
- 大規模クラスタT2K-Tsukubaと大気大循環モデルコード実行(大規模数値計算の現状と今後の展開-その2)
- 演算加速機構を持つオンチップメモリプロセッサの電力性能評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 高性能計算 : システムと応用の良き仲人を目指して(HPC研究会)(研究会千夜一夜)
- 高性能・耐故障マルチリンクEthernet結合システムのNFSへの適用と評価(クラスタとグリッド技術)
- ユーザ透過に利用可能な耐故障・高性能マルチリンクEthernet結合システム(クラスタと省電力技術)
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ:PEACH (集積回路)
- マルチパスネットワークを持つPCクラスタにおける動的経路制御システム(クラスタシステム)
- ディペンダブルな組込みシステムに適した省電力高性能通信機構(通信とグリッドII)
- tagged-VLANを用いたPCクラスタ向けマルチパスネットワークにおける動的ルーティング(HPC-13 : 通信II)
- OpenMPを用いた並列ベンチマークプログラムによる組込み向けマルチコアプロセッサの評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- C452 複雑地形・都市を対象とした並列LESモデルの開発(大気境界層II,一般口頭発表)
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価 (ディペンダブルコンピューティング)
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価 (コンピュータシステム)
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 高性能計算のための低電力・高密度クラスタMegaProto(HPCハードウェア)
- PCクラスタにおけるDVS制御による電力性能の最適化(ARC-3: 低電力アーキテクチャ1, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 高性能計算のための低電力・高密度クラスタMegaProto(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 高性能計算のための低電力・高密度クラスタ MegaProto
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチレール相互結合網における通信プロファイリングに基づく性能最適化
- トラフィック量に適応する非対称マルチリンクEthernetトランキング
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- XcalableMPによるNAS Parallel Benchmarksの実装と評価
- 計算素粒子物理学分野の国際データグリッドILDGと国内グリッドJLDG(グリッドI)
- PACS-CSにおける隣接通信性能の高速化(HPC-13 : 通信II)
- PACS-CSのための高性能通信ライブラリインターフェイスの設計(HPC-12 : 大規模運用システム(2))
- 仮想マシンとSpecCデバイスモデルを統合したデバイス故障エミュレータの実現
- 演算加速機構を持つオンチップメモリプロセッサの検討と電力性能評価
- 科学技術計算用超並列クラスタPACS-CSの実装と基本性能評価(HPC-12 : 大規模運用システム(2))
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 非対称な形状に適応する高バンド幅multi-link Ethernet
- 組込み機器向けon-chip/off-chipコア間通信機構
- 編集にあたって(平成20年度論文賞の受賞論文紹介)
- 高性能・耐故障マルチリンクEthernet結合システムの性能評価
- ユーザ透過に利用可能な高性能・耐故障マルチリンクEthernet結合システム
- メモリバンド幅に着目したマルチコアノード上のアプリケーション最適化
- 複数Gigabit Ethernetを用いたPACS-CSのための高性能通信機構の設計と評価(ネットワーク)
- PACS-CSのためのEthernetを用いた高性能通信機構の設計(HPC-8: 高性能クラスタ)
- 演算加速装置に基づく超並列クラスタHA-PACSによる大規模計算科学
- スクリプト言語Xcryptによる格子QCDシミュレーションの最適化
- PCI Expressを用いた通信リンクPEARLにおけるネットワーク管理機構
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- 気象モデルの高解像度計算のGPU化
- PCI ExpressネットワークPEARLにおける耐故障機構
- Tightly Coupled Acceleratorsアーキテクチャのための通信機構
- Tightly Coupled Acceleratorsアーキテクチャ向け通信機構の予備評価
- Tightly Coupled Acceleratorsアーキテクチャ向け通信機構の予備評価
- フラグメント分子軌道法に現れるFock行列計算のGPGPU化
- Tightly Coupled Acceleratorsアーキテクチャに基づくGPUクラスタの構築と性能予備評価
- PEACH2におけるパイプライン実行の検討(FPGA応用,リコンフィギャラブルシステム,一般)
- TCAノードにおけるランタイムバイナリアクセラレーションの検討(FPGA応用(2),リコンフィギャラブルシステム,一般)