擬似ベクトルプロセッサによるリストベクトル処理
スポンサーリンク
概要
- 論文の詳細を見る
大規模科学技術計算では、データ領域が非常に大きく、データ参照に時間的局所性が少ないため、プロセッサの高い処理能力に貢献するはずのキャッシュメモリが有効に働かないことが多い。そのためプロセッサの実効性能はキャッシュミス時の主記憶アクセスペナルテイにより著しく低下する。これに対し小容量のベクトルレジスタを備え、マルチスレッド機能等を追加し、またload/store pipelineを強化してスーパスカラパイプラインを切れ目なく有効に働かせようというマイクロベクトルプロセッサアーキテクチャも提案されている。我々は、スーパスカラ処理方式の利点を活用し、従来のスカラプセッサとの上位互換性を保ちながらこれらの問題を解決した擬似ペクトルプロセッサを提案している。本稿では、擬似ペクトルプロセッサに対しさらに汎用レジスタのレジスタウィンドウ化を行うことにより、上位互換性を保ちながらリストベクトル処理を効率よく扱う手法を提案する。そしてこの手法の簡単な評価を行う、その有効性を示す。
- 1992-09-28
著者
関連論文
- HMCS-G : グリッド環境における計算宇宙物理のためのハイブリッド計算システム(グリッド応用)
- Heterogeneous Multi-Computer Systemにおける重力効果を含む宇宙輻射流体計算
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- Etheretによるクラスタ上での分散共有メモリOpenMP Omni/SCASHの性能評価
- 超並列計算機CP-PACSにおけるPVMの実装
- CP-PACSパイロットモデルにおけるLINPACKベンチマークの高速化
- CP-PACSパイロットモデルにおけるNAS並列ベンチマークの評価
- 超並列計算機CP-PACSにおけるNAS-PBの仮想評価
- 超並列計算機用多段結合網における転送性能の解析 (並列処理)
- ハイパクロスバ・ネットワークにおける転送性能向上のための手法とその評価
- ハイパクロスバ・ネットワークのスループットの理論的解析
- ハイパクロスバ網における適応ルーチングの導入とその評価
- ハイパクロスバ・ネットワークの転送性能の解析
- ハイパクロスバ・ネットワークにおけるバッファの利用法と転送性能について
- ハイパクロスバ・ネットワークにおけるバーチャル・カット・スルーの性能評価
- 超低電力メガスケールシステムのプロトタイプ : MegaProto(高性能システム)
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 超並列相互結合網におけるバッファ制御方式の改良
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- VHDLによるハイパクロスバ網用ルータ・チップの設計
- プロセッサの消費電力測定と低消費電力プロセッサによるクラスタの検討(省電力)
- 低消費電力プロセッサによるクラスタの検討(ARC-6:低消費電力化)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- 超並列ネットワーク・シミュレータ生成系INSPIREにおけるネットワーク記述検証システムの実装
- ハイパクロスバ網における迂回ルーティング・アルゴリズムに関する研究
- 並列処理ネットワークのための性能評価用シミュレータ生成系INSPIRE
- NASPB CG, FTにおけるSCIMAの性能評価
- 超並列計算機CP-PACSにおけるNPB Kernel CGの評価(並列処理)
- 超並列計算機CP-PACSのネットワーク性能評価
- 超並列計算機CP-PACSの基本性能評価
- 方式レベル記述言語AIDLを用いた高性能プロセッサ設計支援
- 擬似ベクトルプロセッサにおける高速リストベクトル処理
- 超並列計算機CP-PACSのCGベンチマークによる性能評価
- 並列計算機の仮想性能評価システムVIPPES
- ハイパクロスバ・ネットワークにおけるVirtual Channelの動的選択による適応ルーティング
- 計算物理学研究用並列計算機 : CP-PACS
- 2. 超並列計算機 CP-PACS のアーキテクチャ ( 計算物理学と超並列計算機 : CP-PACS計画)
- 21世紀に向けた計算機アーキテクチャ
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 超並列計算機のためのCommodity Networkに基づく並列入出力・可視化システム
- CP-PACSのアーキテクチャの概要
- P2P分散システムXtremWeb上でのGrid RPCシステムOmniRPCの設計(HPC-7 : グリッド(2))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- University of California, Department of Applied Science at Lawrence Livermore National Laboratory訪問記(海外,ラボラトリーズ)
- It's still the Bandwidth!
- これでいいのか?日本のスパコン
- CONFLEX-G : OmniRPCによるグリッド環境上での分子立体配座探索プログラムの実装と性能評価(グリッド応用)
- OmniRPCによる広域ネットワーク環境でのグリッドアプリケーションの性能評価(HPC-5 : グリット(1))(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 分散メモリ型並列計算機における並列入出力システム
- スライドウィンドウ方式による擬似ベクトルプロセッサ
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサ
- レジスタスウィンドウ方式を用いた擬似ベクトルプロセッサの評価
- スライドウインドウを用いた擬似ベクトル処理
- 擬似ベクトルプロセッサによるリストベクトル処理
- 汎用方式レベル記述言語AIDLのシミュレータの実装
- 浮動小数点レジスタウィンドウを用いた擬似ベクトル処理
- ハイパークロス網の拡張について
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化(数値計算)
- MPI上のソフトウェア分散共有メモリシステム(並列処理のためのシステム)
- Omni/SCASHおけるFirst Touch page allocation の実装(ARC-9:ハイパフォーマンスコンピューティング)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 高バンド幅/耐故障性を持つクラスタ向けネットワークRI2Nの性能評価(HPC-4 : ネットワーク)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- ユーザレベルでのマルチリンク利用による高バンド幅/耐故障性を持つクラスタ向け結合ネットワークRI2N
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化
- ItaniumプロセッサによるSCoreクラスタ構築に関する検討(高性能計算及び一般)
- SMP-PCクラスタにおけるSPAM粒子シミュレーションのハイブリッド並列化
- PCクラスタにおける並列一次元FFTのブロックアルゴリズム
- SR8000におけるOpenMPベンチマーク
- SR8000におけるOpenMPベンチマーク
- ハイパフォーマンスコンピューティング向けアーキテクチャSCIMA
- 擬似ベクトルプロセッサPVP-SWにおけるリストベクトル処理
- マルチバンクメモリ上における擬似ベクトルプロセッサPVP-SWの性能評価
- 擬似ベクトルプロセッサPVP-SWのシミュレーション評価
- PVP-SWとハイパクロスバ・ネットワークを用いた計算機の評価
- ハイパクロスバ・ネットワークにおけるNASベンチマークの評価
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサの評価
- ハードウェア記述言語によるsuperscalar及びVLIWプロセッサの設計とその比較
- 方式レベル記述言語AIDLの改良
- 2000-HPC-82-31 汎用可視化ツールAVS/Expressの並列化とその性能評価
- 並列入出力機構を用いた可視化システムの提案
- 超並列計算機CP-PACSにおける大規模分子動力学法シミュレーション (並列処理)
- CP-PACSにおける空間分割法による分子動力学法シミュレーション
- ハイパクロスバ・ネットワークにおける適応ルーティングの実現方法とその評価
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- SPAM粒子シミュレーションコードのハイブリッド並列化
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- 大規模並列処理ネットワークにおけるランダム転送性能の評価
- HPC向けプロセッサのメモリ・アーキテクチャの基本構成
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- ハイパクロスバ・ネットワークの性能評価
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- ハイパクロスバ ・ネットワークにおける並列ソート処理