GPUによる3倍精度浮動小数点演算の検討
スポンサーリンク
概要
- 論文の詳細を見る
近年,プロセッサの演算性能向上に対してメモリやネットワークのバンド幅不足が問題となっている.浮動小数点演算において倍精度演算で精度が不足する場合,4 倍精度演算を用いることが検討されてきたが,データアクセス量が少なくて済む 3 倍精度演算が有効となるケースが存在すると考えられる.本研究では 3 倍精度数を倍精度数と単精度数に分けて格納する Double+Single 型 3 倍精度型 (D+S 型) および D+S 型 3 倍精度演算 (D+S 型演算) を提案し,GPU による 3 倍精度の BLAS(Basic Linear Algebra Subprograms) ルーチンを実装して,その性能をTesla C2050 で評価した.D+S 型演算には Double-Double 型 4 倍精度演算 (DD 型演算) のアルゴリズムにおいて一部演算を単精度演算で行う手法を実装したが,倍精度数-単精度数の型変換が多発し D+S 型演算は DD 型演算よりも高コストとなった.そのため BLAS の入出力を D+S 型で行い,演算には DD 型演算を用いる方式を実装した.Tesla C2050 では 3 倍精度 AXPY が CUBLAS の倍精度 AXPY の約 1.57 倍の実行時間,3 倍精度 GEMV が倍精度 GEMV の約 1.69 倍の実行時間となり,それぞれ 4 倍精度ルーチンよりも高速な性能を示した.本稿では GPU における D+S 型および D+S 型演算の有効性について議論する.
- 2011-11-21
論文 | ランダム
- B-10-73 光アクセス網用 1.3μm 帯光ファイバアンプの開発
- 尿毒症期慢性腎不全患者の免疫能にかんする研究; とくに液性免疫能および透析の影響について
- Prドープフッ化物ファイバモジュールの信頼性
- Prドープフッ化物ファイバモジュールの信頼性
- 6. 高血圧性疾患モデルラットに対する線維芽細胞増殖因子による心不全抑制作用(A. 大学院学生研究発表,第124回 東邦医学会例会)