Pruning Cacheを用いた分散共有メモリのディレクトリ構成法(<特集>並列処理)
スポンサーリンク
概要
- 論文の詳細を見る
Pruning Cacheは, 大規模な CC-NUMA型並列計算機においてディレクトリを動的に構成する手法である.この方法は, ページ単位で共有関係を管理したり, 更新型プロトコルを用いるなど, データ共有を行うプロセッサ数が多い場合に特に有効である.さらに, システムが階層型結合網を持つ場合, 縮約階層ビットマップディレクトリ法(RHBD: Reduced Hierarchical Bitmap Directory)を組み合わせて用いることにより, 互いの弱点を補うことができ, より高い性能を得ることができる.トレースドリブンシミュレーションによる評価の結果, 多くのアプリケーションプログラムにおいて, 32エントリ2wayの構成で75%以上のヒット率を実現することが分かった.さらに大規模な階層型結合網を持つシステムに関して確立モデルにより評価した結果, 従来の1対1転送の方式に比べて転送容量の点でほぼ等しく, レイテンシの点で有利であることが分かった.
- 一般社団法人情報処理学会の論文
- 1998-06-15
著者
-
天野 英晴
慶応義塾大学
-
工藤 知宏
新情報処理開発機構
-
西村 克信
慶応義塾大学大学院 理工学研究科 計算機科学専攻
-
工藤 知宏
産業技術総合研 情報技術研究部門
-
西村 克信
東海大学情報理工学部
-
工藤 知宏
独立行政法人産業技術総合研究所グリッド研究センター
関連論文
- 動的再構成プロセッサアレイMuCCRA-3のマルチコア化の研究 (リコンフィギャラブルシステム)
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- RHiNETプロジェクトの最終報告(耐故障プロセッサとコンピュータシステム)
- 高性能計算をサポートするネットワークインタフェース用コントローラチップMartini
- RHiNETネットワークインタフェースの性能評価
- PLIを用いたネットワークインタフェースコントローラとホストプログラムの協調シミュレーション
- RHiNET/MEMOnetネットワークインタフェース用コントローラチップMartiniの予備評価
- RHINETの概要とMartiniの設計/実装
- RHiNETネットワークインタフェースプロトタイプの性能評価
- 高速性と柔軟性を併せ持つネットワークインタフェース用チップ:Martini
- 光インタコネクトを使った高速転送におけるフロー制御手法
- (2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画)
- WASMII:データ駆動型制御機構をもつMPLD
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- Ether-Forwarding Engineを用いたRDMAコントローラの設計と実装 (ディペンダブルコンピューティング)
- Ether-Forwarding Engineを用いたRDMAコントローラの設計と実装(コンピュータシステム技術1,組込み技術とネットワークに関するワークショップ ETNET2010)
- Cell Broadband Engineを用いたスレッド仮想化環境の提案(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- Impulse Cを用いたLine-Basedアーキテクチャ二次元離散ウェーブレット変換のFPGAへの実装(回路合成,組込み技術とネットワークに関するワークショップ ETNET2010)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の通信性能評価
- RHiNETの高速通信ライブラリPMv2による評価
- RHiNETの高速通信ライブラリPMv2による評価
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- 超並列計算機JUMP-1における分散共有メモリ管理プロセッサMBP-light(並列処理)
- 超並列計算機JUMP-1におけるMBP Core Architectureの評価
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- 教育用パイプライン処理マイクロプロセッサPICO^2の開発
- スケジューリングを考慮した多段結合網スイッチチップの実装
- 実レイアウトによるクロスバの性能評価
- マルチFPGAプラットフォームFLOPS-2Dにおける演算パイプラインの実装(リコンフィギャラブル応用3)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- Impulse Cを用いた離散ウェーブレット変換のFPGAへの実装(アプリケーション1,FPGA応用及び一般)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャ,FPGA応用及び一般)
- H.264エンコーダのコア関数のSTPエンジンへの実装(アプリケーションとシミュレーション,デザインガイア2009 VLSI設計の新しい大地)
- マルチグレイン並列処理を利用したソフトウェア制御キャッシュの開発
- マルチグレイン並列処理を利用したソフトウェア制御キャッシュの開発
- ハードウエア設計のマルチコンテキスト化手法
- ハードウエア設計のマルチコンテキスト化手法
- クラスタコンピュータ用ネットワークインタフェースチップMartiniにおける代行処理機構
- 動的再構成プロセッサアレイMuCCRA-3のマルチコア化の研究(リコンフィギャラブルアーキテクチャ)
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案(高信頼化技術・設計技術)
- FPGA実装されたストリーム暗号CryptMTの評価(セキュリティ応用,デザインガイア2009 VLSI設計の新しい大地)
- LANにおける音声/静止画/データ複合通信の制御法
- 並列計算機(SM)^2-IIへの汎用ニューラル・ネットワーク・シミュレータの実装
- 動的リコンフィギャラブルプロセッサにおける、2電源電圧の動的な割り当てによる電力削減機構の実装(低消費電力設計,FPGA応用及び一般)
- 動的リコンフィギャラブルプロセッサMuCCRA-3向け開発ツールの整備(開発環境,FPGA応用及び一般)
- クロスバ接続による3次元Network-on-Chip向け多層型トポロジ(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- クロスバ接続による3次元Network-on-Chip向け多層型トポロジ(オンチップ・ネットワーク,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 非同期スイッチの試作
- 高性能並列計算用ネットワークRHiNET-1の実装と評価
- 高性能並列計算用ネットワークRHiNET-1の実装と評価
- 仮想ハードウェアWASMIIシステム用コンパイラの実装と評価
- マルチFPGAシステムFLOPS-2Dに向けたパイプライン構築手法の検討(HPCとアーキテクチャ,デザインガイア2009 VLSI設計の新しい大地)
- 多次元構造を持つMIN(並列処理)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の試作
- 動的リコンフィギャラブルプロセッサプロジェクトMuCCRA : コンフィギャラブル設計環境、省電力化、三次元ワイヤレス接続(新しいシステムLSIの展望,デザインガイア2009 VLSI設計の新しい大地)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその低遅延通信機構AOTF(高性能アーキテクチャ)
- DIMMnet-1におけるMartiniオンチッププロセッサによる通信の性能評価
- DIMMnet-1プロトタイプによるバンド幅と大域演算性能の評価
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその高バンド幅通信機構BOTF(並列処理)
- 超並列計算機に向き結合網:RDT
- 可変構造型デバイスを用いた神経回路網シミュレータの実現に関する検討(一般セッションF Funny Architecture II)
- 並行プロセス記述言語NCCの改良
- RHiNETによる共有メモリプログラミングのサポート
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- 並列計算機テストベッドATTEMPTの概観
- バス結合型並列計算機の交信用メモリの性能評価 (並列処理)
- 並列計算機テストベッドATTEMPTの実装と評価
- 効率良い並列処理をサポートするローカルエリア向けネットワークスイッチ
- マルチグレインDSMをサポートするWSクラスタJUMP-1/3
- 科学技術計算用並行記述言語NCC/iのプログラミング環境
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- 軽量メモリーベース通信のためのネットワークインタフェース
- Pruning Cacheを用いた分散共有メモリのディレクトリ構成法(並列処理)
- ローカルメモリを持つマルチプロセッサにおけるアプリケーションの最適化
- 並列計算機のための相互結合網シミュレータSPIDER
- 格子状接続並列計算機用マッピング : ローリングマッピングの効率的なPUアレイの実装例
- ハイパークロス網の拡張について
- 超並列向き結合網Recursive Diagonal Torusの諸特性
- 相互結合網RDTにおけるadaptive routing
- ニューラルネットワークに基づく細密配線アルゴリズムの並列計算機上への実装
- ニューラルネットワークに基づく並列自動配線アルゴリズム
- ATTEMPTのキャッシュコヒーレンシィプロトコル
- 分散型離散系シミュレーションのためのスケジューリング、マッピング手法の検討
- ATTEMPTの同期機構
- SSS型のMINにおけるhot spotの影響とメッセージ結合の効果
- 動的リコンフィギャラブルプロセッサにおける動的電源切替による電力削減効果とオーバーヘッドを低減するマッピング手法(VLSI設計技術,FPGA応用及び一般)
- 動的リコンフィギャラブルプロセッサにおける動的電源切替による電力削減効果とオーバーヘッドを低減するマッピング手法(VLSI設計技術,FPGA応用及び一般)
- 動的リコンフィギャラブルプロセッサにおける動的電源切替による電力削減効果とオーバーヘッドを低減するマッピング手法(VLSI設計技術,FPGA応用及び一般)
- SSS-MIN用LSIチップの実装
- PE直結型動的リコンフィギャラブルプロセッサMuCCRA-Dの提案(リコンフィギャラブルプロセッサ,リコンフィギャラブルシステム,一般)
- ATTEMPTにおけるIEEE Futurebusインタフェース
- 光結合によるマルチリードライトメモリ
- 多重出力可能なMINの性能評価
- 軽量メモリベース通信用ネットワークルータ