GPUによる3倍精度浮動小数点演算の検討
スポンサーリンク
概要
- 論文の詳細を見る
近年,プロセッサの演算性能向上に対してメモリやネットワークのバンド幅不足が問題となっている.浮動小数点演算において倍精度演算で精度が不足する場合,4 倍精度演算を用いることが検討されてきたが,データアクセス量が少なくて済む 3 倍精度演算が有効となるケースが存在すると考えられる.本研究では 3 倍精度数を倍精度数と単精度数に分けて格納する Double+Single 型 3 倍精度型 (D+S 型) および D+S 型 3 倍精度演算 (D+S 型演算) を提案し,GPU による 3 倍精度の BLAS(Basic Linear Algebra Subprograms) ルーチンを実装して,その性能をTesla C2050 で評価した.D+S 型演算には Double-Double 型 4 倍精度演算 (DD 型演算) のアルゴリズムにおいて一部演算を単精度演算で行う手法を実装したが,倍精度数-単精度数の型変換が多発し D+S 型演算は DD 型演算よりも高コストとなった.そのため BLAS の入出力を D+S 型で行い,演算には DD 型演算を用いる方式を実装した.Tesla C2050 では 3 倍精度 AXPY が CUBLAS の倍精度 AXPY の約 1.57 倍の実行時間,3 倍精度 GEMV が倍精度 GEMV の約 1.69 倍の実行時間となり,それぞれ 4 倍精度ルーチンよりも高速な性能を示した.本稿では GPU における D+S 型および D+S 型演算の有効性について議論する.
- 2011-11-21
論文 | ランダム
- 斐伊川流域における鉄穴(かんな)流しによる地形改変
- 斐伊川上流域における鉄宍流し跡の地形 : 昭和56年度地理科学学会例会・中四国都市学会大会合同研究会研究発表要旨
- 島根県飯梨川における河床砂礫の粒度と鉱物組成 : 花崗岩地域の平野形成に関連して
- 話法体の発達について--英語と日本語との場合 (滝本二郎教授退職記念号)
- 話法体の発達について―英語と日本語との場合―