アクセラレータによる四倍精度演算
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,GRAPE-DRやGPU などのメニーコアアクセラレータにおける,四倍精度演算 (DD 演算) の性能評価について報告する.四倍精度相当の演算は倍精度演算器を利用することでエミュレーションすることができる.しかしそのためには DD 演算あたり 20-23 回の倍精度演算が必要であり,DD 演算の演算性能は,倍精度演算性能と比べると 20 分の 1 以下となる.また,通常の CPU では,利用できる論理レジスタが最大で 16 個であるため,DD 演算性能はさらに低下する.一方で,メニーコアアクセラレータをベクトル型演算器と考えると,実効的なレジスタ数が非常に多いため,ループアンローリングが効果的に働くことで,演算レイテンシを完全に隠蔽できる.我々は GRAPE-DR と GPU で DD 演算をおこなうための基本ライブラリとそれを利用するためのコンパイラを開発した.これにより,メニーコアアクセラレータでの DD 演算性能を調べた.結果,通常の CPU での DD 演算性能より 30 - 90 倍の高速化が可能であることがわかった.
- 2009-07-28
著者
関連論文
- 10aSK-7 GRAPE-DRによるループ積分計算(数値的解析,素粒子論領域)
- 宇宙シミュレーションの今後の展開
- Cray XD1での星団進化の高性能「小規模」シミュレーション(高性能計算)
- 球状星団の中心にはブラックホールがある?
- 講座 とんでる力学(12・最終回)剛体の運動(3)グライダーの3次元運動
- 講座 とんでる力学(11)剛体の運動(2)グライダーの安定性
- 講座:とんでる力学(第10回)剛体の運動(1)グライダーが飛べるわけ
- 2.天の川創成プロジェクト(1.シリコンとファイバ上の天文学)(天文学をサポートする情報新技術)
- S604 専用計算機による大規模シミュレーション : GRAPEを例として(超並列計算機によるプラズマ計算機シミュレーション, (社) プラズマ・核融合学会第21回年会)
- 太陽系最外縁部天体の起源に迫る(最近の研究から)
- 講座:とんでる力学(第9回)人工衛星の打ち上げはなぜ大変?
- 講座:とんでる力学(第8回)惑星の軌道(5)多体問題は解けない?
- 講座:とんでる力学(第7回)惑星の軌道(4)2つの惑星
- 講座 とんでる力学(6)惑星の軌道(3)周転円近似
- 講座:とんでる力学(第5回)惑星の軌道(2)本当に楕円軌道?
- 講座:とんでる力学(4)惑星の軌道(1)楕円軌道
- 講座 とんでる力学(3)ボールの軌跡(3)"魔球"を実験する
- 講座:とんでる力学(2)ボールの軌跡(2)空気抵抗
- 講座 とんでる力学(1)ボールの軌跡(1)自由落下
- HMCS-G : グリッド環境における計算宇宙物理のためのハイブリッド計算システム(グリッド応用)
- 第3章 コンピュータにより可能になった新たな科学/工学分野 基礎からの計算科学・工学--シミュレーション (特集 動きのはやい技術動向をより効率的に理解するための用語解説 現代コンピュータ技術の基礎)
- Heterogeneous Multi-Computer Systemにおける重力効果を含む宇宙輻射流体計算
- 大質量ブラックホールの形成過程 : 恒星系の熱力学的進化の観点から
- 専用計算機の将来--GRAPEの挑戦 (特集 計算機科学の新展開--超並列・量子情報・分子計算・計算科学)
- 第3章 シミュレーションの結果は本当に正しいものなのか? 物理シミュレーションの手法と結果の検証 (特集 コンピュータにより可能になった新たな科学/工学分野 基礎からの計算科学・工学--シミュレーション)
- 世界最高速の計算機を作る : 超高速科学技術計算への「手作り」アプローチ(〈特集〉計算科学)
- Heterogeneous Multi-Computer System : 連続体・多粒子系融合型超並列計算機システム
- 重力多体系の数値計算(物性研究者のための計算手法入門)
- 重力多体系の物理と数値計算 : 大自由度系における平衡と緩和(第45回物性若手夏の学校(2000年度)(その2),講義ノート)
- 科学者の活動をどう測るか--科学計量学の視点
- 科学の目 GRAPE-5からGRAPE-6へ--世界最高速計算機からみる計算科学
- ハミルトン系の数値解法--symplectic or symmetric? (特集 ハミルトン力学系の展開--カオス・可積分系へのアプローチ)
- 素粒子反応の自動計算システムと多倍長精度計算
- アクセラレータを活用するためのプログラミング環境
- 行列乗算カーネルの性能評価
- アクセラレータボードを積んだパソコンでの多倍長高性能計算
- 研究ニュース
- アクセラレータによる四倍精度演算
- 高精度浮動小数点演算器のFPGAでの実装(応用1)
- Baileyアルゴリズムによる多倍長演算の性能評価(数値解析,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- Baileyアルゴリズムによる多倍長演算の性能評価(数値解析,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 二重指数関数型積分法の素粒子物理学への応用(数値解析,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 二重指数関数型積分法の素粒子物理学への応用(数値解析,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- ブラックリストを用いたPAM遅延モジュールによるSSHへの攻撃抑制(会場A)
- SNMPによるMACアドレス探索とレイヤ2通過ノード特定ツール(セッション3)
- 高エネルギー加速器研究機構自動計算システム開発グループ(国内,ラボラトリーズ)
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- 新任教官紹介
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- KEK DRAWER (KD) について
- 一般化された標本化定理と近似的な標本化函数
- Verallgemeinerung des Abtast-Theorems und Interpolationsformel
- AM06-19-011 天の川創成プロジェクト(宇宙流体(3),一般講演)
- 26pGE-6 グラフィックボードを用いたファインマン・ループ積分の高速化(26pGE 格子ゲージ理論,数値的解析,素粒子論領域)
- 座談会 原発事故後の"日本的対応"をよむ (特集 科学は誰のためのものか--原発事故後の科学と社会)
- 17aSC-5 グラフィックボードを用いたファインマン・ループ積分の高速化 : その2(17aSC 格子ゲージ理論,数値的解析,素粒子論領域)
- OpenCLによる四倍精度行列積の高速化
- 331 微惑星円盤内での連星形成I等質量微惑星円盤(原始惑星系円盤II,オーラルセッション11)
- 座談会 消えた論理の謎 : 原発事故後の言葉の融解 (特集 科学の : 価値の選択と予測)
- 畑村委員会中間報告に書かれていないこと (2011大震災)
- 専用計算機GRAPEと計算物理 (特集 GRAPEによる計算物理)
- 国策プロジェクトとしてのスパコン開発
- 3.11以後の科学リテラシー(no.02)
- 3.11以後の科学リテラシー(no.04)
- 3.11以後の科学リテラシー(no.03)
- 大規模SIMD型アクセラレータの検討
- 計算宇宙物理のためのGPUクラスタ向け並列Tree Codeの開発と性能評価
- 3.11以後の科学リテラシー(no.08)
- 3.11以後の科学リテラシー(no.06)
- 物質と宇宙の起源と構造 (特集 京コンピュータを中核としたHPC基盤の利用(後編))
- 3.11以後の科学リテラシー(no.12)
- 3.11以後の科学リテラシー(no.05)
- 3.11以後の科学リテラシー(no.09)
- シミュレーションと予測の使われ方 : 福島原発事故をめぐって (特集 "科学的"とは何か)
- 3.11以後の科学リテラシー(no.13)
- 3.11以後の科学リテラシー(no.15)
- 3.11以後の科学リテラシー(no.14)
- 3.11以後の科学リテラシー(no.11)
- 3.11以後の科学リテラシー(no.10)
- 3.11以後の科学リテラシー(no.07)