超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
スポンサーリンク
概要
- 論文の詳細を見る
超並列準汎用計算機 GRAPE-DR は 1 チップに 512 個の演算要素を搭載した SIMD アクセラレータを PC に接続し,これを並列に接続したクラスタシステムである.これは従来の重力多体問題専用計算機 GRAPE の発展形として使用できるように構想されたものであるが,アクセラレータ部分が専用ハードウェアパイプラインではなくプログラム可能な演算器を搭載することでより広い応用が可能であることが大きな特徴である.本論文ではアクセラレータ部で動作する重力相互作用計算と行列積計算ルーチンを実装し,1 ノードでの性能評価をおこなった.現在それぞれのライブラリについて最適化を行っている.現状では重力相互作用計算では 362.6 GFlops (N = 262144),行列積計算では 635.1GFlops (M = N = 32768,K = 2048) の演算性能となった.これを用いて High Performance LINPACK (HPL) の加速を行い,演算性能値は 284.3 GFlops (N = 34816,NB = 2048) となった.
- 一般社団法人情報処理学会の論文
- 2009-07-28
著者
-
菅原 豊
Ibmトーマスj.ワトソン研究所
-
稲葉 真理
東京大学大学院情報理工学系研究科
-
小池 邦昭
総研大
-
牧野 淳一郎
国立天文台
-
福重 俊幸
東京大学総合文化研究科広域科学専攻
-
平木 敬
東京大学情報理工学系研究科
-
平木 敬
東京大学理学部情報科学科
-
今井 浩
東京大学
-
今井 浩
九州大学
-
今井 浩
Erato今井量子計算機構プロジェクト Jst:東京大学情報理工学系研究科コンピュータ科学専攻
-
稲葉 真理
東大
-
平木 敬
東大
-
稲葉 真理
東京大学情報理工学系研究科
-
稲葉 真理
東京大学理学系研究科
-
小池邦昭
総合研究大学院大学
-
藤野健
東京大学
-
福重俊幸
K&F Computing Research Co.
-
台坂博
一橋大学
-
菅原豊
東京大学
-
稲葉真理
東京大学
-
平木敬
東京大学
-
牧野淳一郎
国立天文台
-
今井 浩
Jst‐erato
-
平木 敬
東京大学情報科学科平木研究室
-
平木 敬
電子技術総合研究所電子計算機部計算機方式研究室
-
今井 浩
東京大学理学系研究科情報科学専攻 Erato今井量子計算機構プロジェクト 科学技術振興事業団
-
台坂 博
Graduate School Of Commerce And Management Hitotsubashi University
関連論文
- パケット喪失履歴に基づいたTCP輻輳制御方式 (コンピュータシステム)
- CellおよびGPGPUの性能比較評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ハードウェア・エンジンを用いた10GbE上のTCP通信解析(HPC-17 : 高性能通信)
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 10aSK-7 GRAPE-DRによるループ積分計算(数値的解析,素粒子論領域)
- 宇宙シミュレーションの今後の展開
- Cray XD1での星団進化の高性能「小規模」シミュレーション(高性能計算)
- 球状星団の中心にはブラックホールがある?
- 講座 とんでる力学(12・最終回)剛体の運動(3)グライダーの3次元運動
- 講座 とんでる力学(11)剛体の運動(2)グライダーの安定性
- 講座:とんでる力学(第10回)剛体の運動(1)グライダーが飛べるわけ
- 2.天の川創成プロジェクト(1.シリコンとファイバ上の天文学)(天文学をサポートする情報新技術)
- S604 専用計算機による大規模シミュレーション : GRAPEを例として(超並列計算機によるプラズマ計算機シミュレーション, (社) プラズマ・核融合学会第21回年会)
- 太陽系最外縁部天体の起源に迫る(最近の研究から)
- 講座:とんでる力学(第9回)人工衛星の打ち上げはなぜ大変?
- 講座:とんでる力学(第8回)惑星の軌道(5)多体問題は解けない?
- 講座:とんでる力学(第7回)惑星の軌道(4)2つの惑星
- 講座 とんでる力学(6)惑星の軌道(3)周転円近似
- 講座:とんでる力学(第5回)惑星の軌道(2)本当に楕円軌道?
- 講座:とんでる力学(4)惑星の軌道(1)楕円軌道
- 講座 とんでる力学(3)ボールの軌跡(3)"魔球"を実験する
- 命令フェッチ調節とサイズ可変なReservation Staionによる電力消費最適化(ARC-1:低電力アーキテクチャ,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 並列TCPストリーム間協調を目的とした流量調整機構Stream Equalizerの性能評価(HPC-11:通信,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 細粒度パケット間隔制御の実装と評価(OS-4: 通信システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- インテリジェントNICを用いた高帯域ネットワーク向けTCP通信方式(OS-3:ネットワーク)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラム実行時のキャッシュ連想度の需要予測方式(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 双対モデリングを用いた充足可能性問題のCNF encoding
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Internet2 Land Speed Record : 長距離TCP通信高速化への挑戦
- 超高速インターネット通信におけるFPGA技術の利用(超並列SIMDプロセッサ,先端的コンピュータシステム技術及び一般)
- 実行時の分岐のふるまいに基づくスレッド間データ依存関係予測(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- スラック予測を用いるメモリ制御アーキテクチャ(ARC-10 : アーキテクチャIII,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- TLBを用いるキャッシュ利用状況推定の高精度化(ARC-2 : キャッシュメモリ,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ゲートウェイによる並列TCPのウィンドウサイズ平均化(HPC-15 : ネットワーク)
- Sakura-C : 超並列計算機向けC言語と最適化(HPC-1 : 最適化)
- SIMD型計算機向けループ自動並列化手法
- Webブラウザを用いた長距離データ転送の高速化
- 幾何クラスタリングとデータマイニング
- Ruby用仮想マシンにおけるAOTコンパイラ
- マップ型履歴を用いたプリフェッチ方式とキャッシュ置換方式の協調動作
- トピックス
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- 日米間QoSによるLFN高速化実験と分散KVSの構築(研究発表,ネットワーク研究開発テストベッド運用・利用,一般)
- TCPによる長距離ディスク間データ転送の高速化
- Computational Geometry on Statistical Manifolds for Clustering : Extended Abstract (Models of Computation and Algorithms)
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- フィードバックを用いたハイブリッド・プリフェッチ方式
- 長距離広帯域ネットワークでのTCP/IP Acknowledge Packet受信の影響ついて(インターネット応用及び一般)
- 長距離広帯域ネットワークでのTCP/IP Acknowledge Packet受信の影響ついて(インターネット応用及び一般)
- 10ギガビットネットワーク上での高効率TCP/IP通信の実現(HPC-17 : 高性能通信)
- Real Long Fat NetworkにおけるTCP/IPv6の通信性能評価(インターネット及び一般)
- Real Long Fat NetworkにおけるTCP/IPv6の通信性能評価(インターネット及び一般)
- FLASHを用いたリアルタイム講演中継システムとその特性(インターネット運用・管理技術,一般,インターネット運用・管理技術,一般)
- 擬似ネットワーク環境におけるTCP/IPの性能評価(インターネット及び一般)
- 擬似ネットワーク環境におけるTCP/IPの性能評価(インターネット及び一般)
- TCPストリームによる世界最長10ギガビット高速通信回線実験 : Internet2 Land Speed Recordへの挑戦(インターネット・フォトニックネットワークアプリケーション, 一般)
- TCPストリームによる世界最長10ギガビット高速通信回線実験 : Internet2 Land Speed Record への挑戦
- 高レイテンシ環境下におけるデータレゼボワールの性能評価
- MK-4 Data Reservoir : 科学技術研究向け超高速ネットワーク基盤(大型プロジェクト紹介,学術系企画)
- 超高速ネットワーク用データ共有システム : データレゼボワールの性能評価
- Data Reservoirプロトタイプシステム : アプローチと実験結果
- Data Reservoir : 理学研究のための新しい超高速ネットワーク利用基盤
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- パケット喪失履歴に基づいたTCP幅輳制御方式(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- CometインテリジェントNICの応用(第1版)(ネットワーク・インターネット基礎,産学連携論文)
- Comet インテリジェントNICの応用(第1版)
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- 協調動作する並列TCPストリームへのPacket Spacingの適用とその評価(HPC-10 : ネットワークとスケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- ギガビットイーサネット上での遠距離TCP通信におけるPacket Spacing(インターネット関連技術,及び一般)
- ギガビットイーサネット上での遠距離TCP通信におけるPacket Spacing(インターネット関連技術,及び一般)
- 地理情報システムの標準化動向と参照モデル
- 超並列SIMDマシン上でのMIMDプログラム実行スケジューリング最適化(大規模システム,SWoPP2006)
- flat-c: 超並列計算機向けC言語の実現(HPC-9: 並列プログラミング)
- RL-001 FPGAを用いた広帯域高遅延ネットワーク向けの利用可能帯域推定(L分野:ネットワーク・セキュリティ,査読付き論文)
- 長距離・短距離通信が混在する環境でのTCP/IPのデータ転送速度の理論的解析
- MK-5 戦略ソフトウェア創造人材養成プログラム(大型プロジェクト紹介,学術系企画)
- ランダマイズドクラスタリングアルゴリズムに関する実験結果について
- BDDを用いたデータマイニング
- HPC Ruby:静的解析に基づくRubyの高度最適化コンパイラ
- BTBへのBimode Cascading手法適用による分岐先アドレス予測の高効率化
- 多様な履歴の利用による分岐予測精度の向上
- 実用的なRuby用AOTコンパイラ
- 並列TCPストリームのための流量割り当て方式(HPC-2 : 通信方式)
- 動的再構成を用いたアプリケーションレイヤ処理エンジンの設計(ネットワーク, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- ネットワークプロセッサに適したマルチスレッド実行コアの構成
- ネットワークプロセッサに適したマルチスレッド実行コアの構成
- 2000-ARC-139-22 各命令の振る舞いを考慮した命令フェッチ機構
- レイテンシ予測に基づいた命令フェッチ機構
- バンド幅チャレンジとネットワーク背景技術
- 情報検索・全文データベースでの文書クラスタリングでの幾何構造活用
- データマイニングでのクラスタリング