OpenCLによる四倍精度行列積の高速化
スポンサーリンク
概要
- 論文の詳細を見る
四倍精度演算の実装方法として二つの倍精度数を用いてエミュレートするものがあるが,このエミュレーションによる実装を利用した場合,一度の四倍精度演算に多くの倍精度演算が必要となる.そのため,常用するには高速化が望ましい.本研究では OpenCL を利用した並列処理による四倍精度行列積の高速化を目指し,その応用としてLU分解の高速化も行った.mpack ライブラリと比較すると我々の OpenCL による行列積は GPU では約 350 倍,マルチコア CPU では約 21 倍の性能を評価でき,また LU 分解においては GPU,マルチコア CPU ともに約 10 倍に近い高速化を実現した.
- 2012-03-19