並列計算機JUMP-1の分散共有メモリ・システム
スポンサーリンク
概要
- 論文の詳細を見る
JUMP-1は, 物理的構成に合わせたクラスタ構造を持つ分散共有メモリ型並列計算機である.JUMP-1では, 大容量のリモート・アクセス・キャッシュによってメモリ・アクセス・レイテンシの短縮を図る一方で, クラスタ間の処理はプログラム・ベースで行われる.そのプログラムにおいては, クラスタ間で交換されるパケットの処理のスケジューリングの方式が重要である.中断が必要な処理に対してはスレッドを生成し, 実行時間の短い処理に対しては, スレッドを生成せず手続き的に実行することで, オーバヘッドの削減を図った.そのプログラムを実装して評価したところ, リモート・アクセス・キャッシュのミス・ペナルティは469サイクルとなった.そのうち, ソフトウェア・オーバヘッドはハードウェアのレイテンシの159.1%にあたり, 許容範囲であるといえる.
- 2000-11-15
著者
-
富田 眞治
京都大学情報学研究科
-
五島 正裕
京都大学情報学研究科
-
森 眞一郎
京都大学情報学研究科
-
小西 将人
大阪工業大学
-
秤谷 雅史
京都大学情報学研究科:(現)トヨタ自動車株式会社
-
斎藤 康二
京都大学情報学研究科:(現)三洋電機株式会社
-
小西 将人
京都大学情報学研究科
関連論文
- 新時代におけるマルチコア戦略(マイクロアーキテクチャ,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 分散システムにおけるFair Shareプライオリティ・スケジューラ
- グローバル分岐履歴を用いたスラック予測器(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズムの改良(並列処理応用)
- フロントエンド実行によるプリロードの提案(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- フロントエンド実行(マルチスレッド実行とプロセッサアーキテクチャ)
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズム(キャッシュの効率的利用)
- リザーベーションステーションと物理レジスタ・ファイルを併用するスーパースケーラ・プロセッサ(ARC-1:プロセッサ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 行列に基づくOut-of-Orderスケジューリング方式の評価
- 直接依存行列型スケジューリングを適用したクラスタ化スーパースケーラ・プロセッサの評価
- 並列計算機JUMP-1の性能評価
- 超並列計算機JUMP-1のマルチキャスト機構による性能向上
- 並列計算機JUMP-1における分散共有メモリ管理の実装
- 並列計算機JUMP-1の分散共有メモリ・システム
- 2000-ARC-139-4 並列計算機JUMP-1における分散共有メモリシステムの性能評価
- 超並列計算機JUMP-1における分散共有メモリ管理の実装とその評価
- 超並列計算機JUMP-1のクラスタの実装及び予備的性能評価
- 超並列計算機プロトタイプJUMP-0.5における分散共有メモリ管理手法
- Dualflowアーキテクチャの命令発行機構
- 2000-ARC-139-19 Superscalarにおける低遅延な命令スケジューリング方式
- 2000-ARC-139-18 Dualflowアーキテクチャの命令発行機構
- パネル討論 : 新時代におけるマルチコア戦略(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- スーパースケーラのための高速な動的命令スケジューリング方式
- スーパースケーラのための高速な動的命令スケジューリング方式
- 高性能マイクロプロセッサの発展過程と今後(計算システムとファイルシステム,SANを用いた高性能コンピュータシステム,及び一般)
- 計算機アーキテクチャの過去, 現在と未来 : 情報処理技術 : 過去十年そして今後の十年
- Dualflowアーキテクチャとそのコード生成手法