フラグメント分子軌道法に現れるFock行列計算のGPGPU化

スポンサーリンク

概要

論文の詳細を見る
OpenFMOプログラムのFock行列計算についてCUDAによるGPGPU化を行った.コストの高いアトミック加算についてはこれを回避するFock行列計算手法を提案し実装した.さらにスクリーニング過程の分離や動的負荷分散の実現,基底関数のソートなど多くの高速化の技法を実装することにより1CPUコアに対し13倍から22倍程度の性能を実現した.より高速なFock行列計算を目指し,MPIを利用した複数GPUによる並列化についての実装も行った.16台のGPUを利用した計算で4CPUコアに比べ40倍程度の性能が得られた.
2013-10-30

著者

関連論文

もっと見る

スポンサーリンク