超並列計算機のための同期処理機構とその評価
スポンサーリンク
概要
- 論文の詳細を見る
超並列計算機において, 同期処理の高速化は重要な問題であり, ハードウェア支援による処理の効率化が効果的であることはよく知られている. しかし一方で, 超並列計算機では実装上の制約が大きく, すべての同期処理をハードウェア化することは現実的でない. 本論文では, 超並列計算機のための同期処理機構として, メッセージ処理を基礎とした単純なマイクロ同期機構を提案し, これをソフトウェアで操作し組み合わせることで, さまざまな同期処理を効率良く実現できることを示す. さらにこのマイクロ同期機構を超並列計算機RWC-1に実装し, その処理性能を評価する. その結果, マイクロ同期機構が特に細粒度並列処理において大きな性能向上をもたらすことが確認された. 同時に, バリアなどのマクロな同期においても, マイクロ同期機構をソフトウェアで組み合わせることで, 専用のハードウェアを持つ他の並列計算機にひけをとらない性能を示すことが確認された.
- 一般社団法人情報処理学会の論文
- 1999-03-15
著者
-
佐藤 三久
新情報処理開発機構
-
松岡 浩司
日本電気株式会社 C&c メディア研究所
-
松岡 浩司
Rwcp並列分散パフォーマンス研究室:(現)nec C&c メディア研究所
-
廣野 英雄
三洋電機株式会社
-
横田 隆史
三菱電機(株)先端技術総合研究所
-
岡本 一晃
三洋電機株式会社
-
横田 隆史
三菱電機株式会社先端技術総合研究所
-
坂井 修一
東京大学工学系研究科電気工学
-
佐藤 三久
新情報処理開発機構つくば研究センタ
-
横田 隆史
三菱電機株中央研究所システム基礎研究部
-
松岡 浩司
日本電気株式会社
-
坂井 修一
東京大学工学研究科電気工学専攻
関連論文
- Cluster-enabled OpenMP : ソフトウェア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- GByte/sクラス skewless並列光インターコネクション (2)
- GByte/sクラスskewless並列光インターコネクション
- メタレベル機能によるクラスライブラリ最適化手法(並列処理)
- メタレベル機能が支援するハイパフォーマンスオブジェクト指向計算
- メタレベル機能による並列プログラミング
- 2000-HPC-82-14 ソフトウエア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- リアルワールドコンピューティングにおける光インターコネクション
- 超並列計算機RWC-1搭載光インタコネクト
- 超並列計算機RWC-1内光インタコネクトシステム
- 超並列計算機RWC-1における光インターコネクション
- 超並列計算機応用光インターコネクション技術
- 2000-HPC-81-13 Network Enabled Server System の設計
- グローバルコンピューティングのためのスケジューリングフレームワーク(並列処理)
- グローバルコンピューティングシステムNinfを用いた数値流体解析コンポーネントnetCFD
- Javaによる大域的並列計算環境Ninflet (並列処理)
- グローバルコンピューティングシステムのシミュレーションによる評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- 広域計算システムNinfにおけるユーザ認証
- 複数クライアントによるLAN/WANでのNinfの性能(並列処理)
- Ninfによる広域分散並列計算(並列処理)
- MPC++による様々な並列処理プログラミングスタイルのサポートとその性能
- Ninfによる広域分散並列計算
- ネットワーク数値情報システムNinf : マルチクライアント環境での性能
- 分散メモリ計算機用Ninf APIの実現に向けて
- ネットワーク数値情報ライブラリNinf : システム実装と評価
- Parallel STLによる並列プログラミング
- 超並列計算機のための同期処理機構とその評価
- 超並列計算機RWC-1の入出力機構とその基礎評価(並列処理)
- 超並列計算機BWC-1相互結合網ルータの実現
- マルチスレッド計算機における同期機構とパイプライン構成
- 超並列要素プロセッサRICA-1とその基本性能
- 超並列要素プロセッサRICA-1とその基本性能
- 超並列要素プロセッサRICA-1とその基本性能
- 相互結合網のトポロジを活かしたシステム支援機能とその評価
- 超並列計算機におけるマルチスレッド処理機構と基本性能
- RWC-1の要素プロセッサ : 細粒度並列処理機能の強化
- RWC-1 におけるスレッド実行と基本性能
- RWC-1の入出力機構と基本性能
- ファイアウォールに対応したGlobusによる広域クラスタシステムの構築とその評価
- 2000-HPC-81-12 Firewellに対応したGlobusによる広域クラスタシステムの構築と性能評価
- GlobusにおけるResource Managerの試作 : グローバルコンピューティング環境の構築に向けて
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 細粒度通信機構を持つ並列計算機EM-Xによる疎行列計算の性能評価
- 細粒度通信機構を用いたRadixソートの実行
- 行列演算ベンチマークを用いた並列計算機EM-Xの評価
- RWC-1のシステム構成と基本動作
- OpenMP向けコンパイラ支援ソフトウェアDSMにおける最適化コンパイル手法
- RWC-1の入出用ATMノード
- RWC-1のマルチスレッド処理機構
- RWC-1における多レベル並列処理
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- SMPクラスタ向けOpenMPコンパイラ
- SMPクラスタ向けネットワーク・インタフェースAM通信 (並列処理)
- COMPaS : Pentium Proを用いたSMPクラスタとその評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- SMPクラスタ向けネットワーク・インタフェース上AM通信
- SMPクラスタでの共有/分散融合プログラミング
- Knapsack問題における共有メモリ型/分散メモリ型並列計算機の性能比較
- 並列非圧縮性流体解析プログラムのオブジェクト指向言語による実装と評価
- C++テンプレート・ライブラリを用いた行列解法の並列化
- RHiNETによる共有メモリプログラミングのサポート
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- 超並列計算機RWC-1のPE間スキューレス光並列接続
- SMPクラスタにおけるコレスキー分解の並列化
- SMPクラスタ上でのリモートメモリ転送を用いた通信と計算のオーバーラップによる性能改善
- SMPクラスタCOMPaSの性能評価
- 2000-HPC-82-13 OpenMP並列プログラムのデータフロー解析手法
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- F01-(4) RWCP における計算機クラスタ技術
- グローバルコンピュ-ティングへの期待
- 並列処理に「難しい」並行処理は必要か
- 特集「並列処理」の編集にあたって
- ハイパフォーマンスアプリケーションにおけるC++ STLを用いたプログラミング
- 細粒度並列アーキテクチャ用SISALコンパイラにおける並列粒度調整方式(並列処理)
- 並列粒度調整機能を組み込んだSISALコンパイラの設計と実装
- 光インタコネクションネットワークを用いたコンピューテングクラスタの構想
- Omni OpenMPコンパイラの性能評価
- OpenMP向けコンパイラ支援ソフトウェアDSM
- OpenMP向けコンパイラ支援ソフトウェアDSMの性能評価
- Cenju-4の分散共有メモリ機構を用いたOmni OpenMPコンパイラ
- Omni OpenMPコンパイラの性能評価
- Omni OpenMPコンパイラの性能評価
- OpenMPコンパイラの試作と評価
- Windows NTクラスタ上でのMyrinetによる通信の実現
- C++テンプレートを使ったデータ並列ライブラリの効率化手法
- 大規模データ並列プログラムの性能予測手法とNPB 2.3の性能評価 (並列処理)
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- テンプレート・クロージャによる並列アレイ・ライブラリ
- Collective通信を用いたデータ並列プログラムの性能予測
- 並列アルゴリズムにおけるCollective通信の性能比較