マルチバンクメモリ上における擬似ベクトルプロセッサPVP-SWの性能評価
スポンサーリンク
概要
- 論文の詳細を見る
大規模な科学技術計算の分野では、データ領域が非常に大きく、データの時間的局所性は少ない。そのためスカラプロセッサではデータキャッシュが有効に働かず、主記憶アクセスペナルティのため性能が著しく低下する。そこで我々は主記憶アクセスレーテンシを効果的に隠蔽し、スカラプロセッサであってもベクトル処理を効率良く行なう擬似ベクトルプロセッサPVP-SWを提案している。本研究では、主記憶にマルチバンク構成を用いた擬似的なパイプラインメモリを想定したPVP-SWの性能評価を行なう。また、その他の主記憶アクセスレーテンシ隠蔽方法としてキャッシュへのデータプリフェッチを取り上げ、PVP-SW方式との性能比較を行なう。評価結果より、PVP-SW方式はバンクコンフリクトによって動的に変化する主記憶アクセスレーテンシを効果的に隠蔽することが可能であり、キャッシュへのプリフェッチで問題となる命令オーバーヘッドやメモリトラフィックの増加による影響を受けることもなく、良い性能を示すことが確認できた。
- 一般社団法人情報処理学会の論文
- 1995-03-10
著者
-
朴 泰祐
筑波大学電子・情報工学系
-
中村 宏
筑波大学電子・情報工学系
-
中澤 喜三郎
筑波大学電子・情報工学系
-
広野 哲
筑波大学電子・情報工学系
-
廣野 哲
株式会社日立製作所汎用コンピュータ事業部
-
廣野 哲
筑波大学電子・情報工学系
-
上野 幸樹
筑波大学電子・情報工学系
関連論文
- HMCS-G : グリッド環境における計算宇宙物理のためのハイブリッド計算システム(グリッド応用)
- Heterogeneous Multi-Computer Systemにおける重力効果を含む宇宙輻射流体計算
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- Etheretによるクラスタ上での分散共有メモリOpenMP Omni/SCASHの性能評価
- 超並列計算機CP-PACSにおけるPVMの実装
- CP-PACSパイロットモデルにおけるLINPACKベンチマークの高速化
- CP-PACSパイロットモデルにおけるNAS並列ベンチマークの評価
- 超並列計算機CP-PACSにおけるNAS-PBの仮想評価
- 超並列計算機用多段結合網における転送性能の解析 (並列処理)
- ハイパクロスバ・ネットワークにおける転送性能向上のための手法とその評価
- ハイパクロスバ・ネットワークのスループットの理論的解析
- ハイパクロスバ網における適応ルーチングの導入とその評価
- ハイパクロスバ・ネットワークの転送性能の解析
- ハイパクロスバ・ネットワークにおけるバッファの利用法と転送性能について
- ハイパクロスバ・ネットワークにおけるバーチャル・カット・スルーの性能評価
- 超低電力メガスケールシステムのプロトタイプ : MegaProto(高性能システム)
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 超並列相互結合網におけるバッファ制御方式の改良
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- VHDLによるハイパクロスバ網用ルータ・チップの設計
- プロセッサの消費電力測定と低消費電力プロセッサによるクラスタの検討(省電力)
- 低消費電力プロセッサによるクラスタの検討(ARC-6:低消費電力化)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- 超並列ネットワーク・シミュレータ生成系INSPIREにおけるネットワーク記述検証システムの実装
- ハイパクロスバ網における迂回ルーティング・アルゴリズムに関する研究
- 並列処理ネットワークのための性能評価用シミュレータ生成系INSPIRE
- NASPB CG, FTにおけるSCIMAの性能評価
- 超並列計算機CP-PACSにおけるNPB Kernel CGの評価(並列処理)
- 超並列計算機CP-PACSのネットワーク性能評価
- 超並列計算機CP-PACSの基本性能評価
- 方式レベル記述言語AIDLを用いた高性能プロセッサ設計支援
- 擬似ベクトルプロセッサにおける高速リストベクトル処理
- 超並列計算機CP-PACSのCGベンチマークによる性能評価
- 並列計算機の仮想性能評価システムVIPPES
- ハイパクロスバ・ネットワークにおけるVirtual Channelの動的選択による適応ルーティング
- 計算物理学研究用並列計算機 : CP-PACS
- 2. 超並列計算機 CP-PACS のアーキテクチャ ( 計算物理学と超並列計算機 : CP-PACS計画)
- リストベクトル処理における擬似ベクトルプロセッサPVP-SWの評価
- 21世紀に向けた計算機アーキテクチャ
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 超並列計算機のためのCommodity Networkに基づく並列入出力・可視化システム
- CP-PACSのアーキテクチャの概要
- P2P分散システムXtremWeb上でのGrid RPCシステムOmniRPCの設計(HPC-7 : グリッド(2))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- University of California, Department of Applied Science at Lawrence Livermore National Laboratory訪問記(海外,ラボラトリーズ)
- It's still the Bandwidth!
- これでいいのか?日本のスパコン
- CONFLEX-G : OmniRPCによるグリッド環境上での分子立体配座探索プログラムの実装と性能評価(グリッド応用)
- OmniRPCによる広域ネットワーク環境でのグリッドアプリケーションの性能評価(HPC-5 : グリット(1))(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 分散メモリ型並列計算機における並列入出力システム
- スライドウィンドウ方式による擬似ベクトルプロセッサ
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサ
- レジスタスウィンドウ方式を用いた擬似ベクトルプロセッサの評価
- 擬似ベクトルプロセッサによるリストベクトル処理
- 汎用方式レベル記述言語AIDLのシミュレータの実装
- 浮動小数点レジスタウィンドウを用いた擬似ベクトル処理
- ハイパークロス網の拡張について
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化(数値計算)
- MPI上のソフトウェア分散共有メモリシステム(並列処理のためのシステム)
- Omni/SCASHおけるFirst Touch page allocation の実装(ARC-9:ハイパフォーマンスコンピューティング)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 高バンド幅/耐故障性を持つクラスタ向けネットワークRI2Nの性能評価(HPC-4 : ネットワーク)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- ユーザレベルでのマルチリンク利用による高バンド幅/耐故障性を持つクラスタ向け結合ネットワークRI2N
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化
- ItaniumプロセッサによるSCoreクラスタ構築に関する検討(高性能計算及び一般)
- SMP-PCクラスタにおけるSPAM粒子シミュレーションのハイブリッド並列化
- PCクラスタにおける並列一次元FFTのブロックアルゴリズム
- SR8000におけるOpenMPベンチマーク
- SR8000におけるOpenMPベンチマーク
- ハイパフォーマンスコンピューティング向けアーキテクチャSCIMA
- 擬似ベクトルプロセッサPVP-SWにおけるリストベクトル処理
- マルチバンクメモリ上における擬似ベクトルプロセッサPVP-SWの性能評価
- 擬似ベクトルプロセッサPVP-SWのシミュレーション評価
- PVP-SWとハイパクロスバ・ネットワークを用いた計算機の評価
- ハイパクロスバ・ネットワークにおけるNASベンチマークの評価
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサの評価
- ハードウェア記述言語によるsuperscalar及びVLIWプロセッサの設計とその比較
- 方式レベル記述言語AIDLの改良
- 2000-HPC-82-31 汎用可視化ツールAVS/Expressの並列化とその性能評価
- 並列入出力機構を用いた可視化システムの提案
- 超並列計算機CP-PACSにおける大規模分子動力学法シミュレーション (並列処理)
- CP-PACSにおける空間分割法による分子動力学法シミュレーション
- ハイパクロスバ・ネットワークにおける適応ルーティングの実現方法とその評価
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- SPAM粒子シミュレーションコードのハイブリッド並列化
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- 大規模並列処理ネットワークにおけるランダム転送性能の評価
- HPC向けプロセッサのメモリ・アーキテクチャの基本構成
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- ハイパクロスバ・ネットワークの性能評価
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- ハイパクロスバ ・ネットワークにおける並列ソート処理