Cenju-4の分散共有メモリ機構を用いたOmni OpenMPコンパイラ
スポンサーリンク
概要
- 論文の詳細を見る
共有メモリ向けの並列化インタフェースであるOpenMPプログラムを、分散メモリシステム上でも透過的に動作させる機能の研究が注目されている.我々は、NECで開発したCenju-4に搭載されている、ハードウェアによる分散共有メモリ(DSM)機能を利用する機能を開発し、それをOmni OpenMPコンパイラに組み込んで初期評価を行った.並列プログラムの変換は、ソフトウェアDSM向けに開発したシステムを利用することが可能であり.実行時ライブラリの移植のみで対応可能であった。ベンチマークプログラムを用いてこのシステムの初期評価を行ったところ、NPBのCGで2PEを用いた並列実行が、逐次実行とほぼ同じ性能であったが、4PE以上で性能高向上することが確認できた。
- 一般社団法人情報処理学会の論文
- 2000-10-06
著者
-
佐藤 三久
新情報処理開発機構
-
草野 和寛
新情報処理開発機構
-
妹尾 義樹
日本電気(株)C&C研究所
-
佐藤 三久
新情報処理開発機構つくば研究センタ
-
細見 岳生
日本電気(株)C&C研究所
-
細見 岳生
日本電気(株)
-
妹尾 義樹
Nec C&c研究所
-
草野 和寛
新情報処理開発機構つくば研究センタ
関連論文
- Cluster-enabled OpenMP : ソフトウェア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- メタレベル機能によるクラスライブラリ最適化手法(並列処理)
- メタレベル機能が支援するハイパフォーマンスオブジェクト指向計算
- メタレベル機能による並列プログラミング
- 2000-HPC-82-14 ソフトウエア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- 2000-HPC-81-13 Network Enabled Server System の設計
- グローバルコンピューティングのためのスケジューリングフレームワーク(並列処理)
- グローバルコンピューティングシステムNinfを用いた数値流体解析コンポーネントnetCFD
- Javaによる大域的並列計算環境Ninflet (並列処理)
- グローバルコンピューティングシステムのシミュレーションによる評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- 広域計算システムNinfにおけるユーザ認証
- 複数クライアントによるLAN/WANでのNinfの性能(並列処理)
- Ninfによる広域分散並列計算(並列処理)
- MPC++による様々な並列処理プログラミングスタイルのサポートとその性能
- Ninfによる広域分散並列計算
- ネットワーク数値情報システムNinf : マルチクライアント環境での性能
- 分散メモリ計算機用Ninf APIの実現に向けて
- ネットワーク数値情報ライブラリNinf : システム実装と評価
- Parallel STLによる並列プログラミング
- 4.科学技術計算のベンチマーク (計算機ベンチマークの最新動向)
- データ並立言語HPFの拡張機能仕様
- 超並列計算機のための同期処理機構とその評価
- ファイアウォールに対応したGlobusによる広域クラスタシステムの構築とその評価
- 2000-HPC-81-12 Firewellに対応したGlobusによる広域クラスタシステムの構築と性能評価
- GlobusにおけるResource Managerの試作 : グローバルコンピューティング環境の構築に向けて
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 細粒度通信機構を持つ並列計算機EM-Xによる疎行列計算の性能評価
- データ並列言語HPFの拡張機能仕様HPF/JA
- 細粒度通信機構を用いたRadixソートの実行
- 行列演算ベンチマークを用いた並列計算機EM-Xの評価
- 投機的実行研究の最新動向とタスク間投機的実行の有効性
- 細粒度通信機構をもつ並列計算機EM-Xによる疎行列問題の並列処理
- RWC-1のシステム構成と基本動作
- Unlimited Speculative Executionの制御オーバヘッド削減手法
- 高並列計算機EM-Xのリモートメモリ参照機構の評価
- OpenMP向けコンパイラ支援ソフトウェアDSMにおける最適化コンパイル手法
- 並列計算機EM-4の細粒度通信による共有メモリの実現とマルチスレッドによるレーテンシ隠蔽
- 並列計算機EM-4におけるマクロタスク間投機的実行の分散制御方式
- 並列計算機 EM-4 の並列プログラミング言語 EM-C
- ループ間DOACROSS方式の並列計算機EM-4上での評価
- 並列計算機EM-Xのプロセッサ・ネットワークインターフェースの最適化の検討
- 多段先行評価方式の並列計算機EM-4上での予備評価
- EM-Cによるニューラルネットワークの実現
- EM-Cによる共有二分決定グラフの並列処理
- EM-Cによる粒度最適化の検討
- EM-Cによるアクティビティ分散方式の検討
- 並列計算機EM-4の並列プログラミング言語画EM-C
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- SMPクラスタ向けOpenMPコンパイラ
- SMPクラスタ向けネットワーク・インタフェースAM通信 (並列処理)
- COMPaS : Pentium Proを用いたSMPクラスタとその評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- SMPクラスタ向けネットワーク・インタフェース上AM通信
- SMPクラスタでの共有/分散融合プログラミング
- Knapsack問題における共有メモリ型/分散メモリ型並列計算機の性能比較
- マルチプロセッサスーパコンピュータPHIの研究開発 マルチプロセッサスーパコンピュータPHIにおける拡張記憶システム (マルチプロセッサスーパコンピュータPHIの研究開発)
- 並列非圧縮性流体解析プログラムのオブジェクト指向言語による実装と評価
- C++テンプレート・ライブラリを用いた行列解法の並列化
- RHiNETによる共有メモリプログラミングのサポート
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- SMPクラスタにおけるコレスキー分解の並列化
- SMPクラスタ上でのリモートメモリ転送を用いた通信と計算のオーバーラップによる性能改善
- SMPクラスタCOMPaSの性能評価
- 2000-HPC-82-13 OpenMP並列プログラムのデータフロー解析手法
- Globus ToolkitのNEC SX-4/5への移植および評価
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- F01-(4) RWCP における計算機クラスタ技術
- グローバルコンピュ-ティングへの期待
- 並列処理に「難しい」並行処理は必要か
- 特集「並列処理」の編集にあたって
- ハイパフォーマンスアプリケーションにおけるC++ STLを用いたプログラミング
- 細粒度並列アーキテクチャ用SISALコンパイラにおける並列粒度調整方式(並列処理)
- 並列粒度調整機能を組み込んだSISALコンパイラの設計と実装
- 共有メモリワークステション向けCコンパイラの並列化機能による並列化
- 光インタコネクションネットワークを用いたコンピューテングクラスタの構想
- 並列化支援環境 PCASE における分散メモリ対応機能
- Omni OpenMPコンパイラの性能評価
- OpenMP向けコンパイラ支援ソフトウェアDSM
- OpenMP向けコンパイラ支援ソフトウェアDSMの性能評価
- Cenju-4の分散共有メモリ機構を用いたOmni OpenMPコンパイラ
- Omni OpenMPコンパイラの性能評価
- Omni OpenMPコンパイラの性能評価
- OpenMPコンパイラの試作と評価
- Windows NTクラスタ上でのMyrinetによる通信の実現
- C++テンプレートを使ったデータ並列ライブラリの効率化手法
- 大規模データ並列プログラムの性能予測手法とNPB 2.3の性能評価 (並列処理)
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- テンプレート・クロージャによる並列アレイ・ライブラリ
- Collective通信を用いたデータ並列プログラムの性能予測
- 並列アルゴリズムにおけるCollective通信の性能比較