オンチップメモリを用いたHPCプロセッサの検討
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, CPUとメモリをシングルチップ上に融合させたプロセッサ・メモリ混載型LSIについて, 特にHPC分野をターゲットにしたアーキテクチャの検討を行なう.プロセッサ・メモリ混載型LSIでは, オンチップメモリに対するアクセスが低レーテンシかつ高バンド幅であるため, 性能向上が期待されるが, HPCではワーキングセットが大きく, オンチップメモリにそのすべてが収まりきらないことが多い。ここでは, 最初に, HPC用VLSIアーキテクチャとしてオンチップメモリ, オフチップメモリの両者を持つアーキテクチャを考え, その命令セットおよびハードウェア構成の概略を提案する。次に, オンチップ・オフチップ両メモリのスループット, 浮動小数点演算器数などをパラメータとして, いくつかのプログラムについての予備実験を行ない, アーキテクチャの諸元を設定する。さらに, Linpackベンチマークプログラムにおける性能予測では, オンチップメモリを用いたブロッキングを行なうことにより, プロセッサ・メモリ混載型LSIで高性能が得られることを確認した。
- 一般社団法人情報処理学会の論文
- 1999-03-04
著者
-
朴 泰祐
筑波大学電子・情報工学系
-
中村 宏
東京大学先端科学技術研究センター
-
坂井 修一
東京大学工学系研究科電気工学
-
近藤 正章
筑波大学電子・情報工学系:(現)東京大学先端科学技術研究センター
-
坂井 修一
東京大学工学研究科電気工学専攻
関連論文
- 5K-7 省電力MIPSプロセッサコア評価のための計算機システムのFPGAによる試作(マルチスレッドと省電力,学生セッション,アーキテクチャ)
- HMCS-G : グリッド環境における計算宇宙物理のためのハイブリッド計算システム(グリッド応用)
- Heterogeneous Multi-Computer Systemにおける重力効果を含む宇宙輻射流体計算
- 演算加速機構を持つオンチップメモリプロセッサの電力性能評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 非同期式カスケードALUアーキテクチャ
- 非同期式パイプライン構造の性能評価
- 非同期式カスケードALUプロセッサの評価
- 非同期式カスケードALUアーキテクチャの提案
- 非同期式パイプラインプロセッサの高性能化手法について
- マルチ閾値電圧トランジスタを用いた2線2相式非同期式回路のリーク電力削減手法(遅延・電源ノイズ解析,デザインガイア2008-VLSI設計の新しい大地)
- マルチ閾値電圧トランジスタを用いた2線2相式非同期式回路のリーク電力削減手法(遅延・電源ノイズ解析,デザインガイア2008-VLSI設計の新しい大地-)
- リソース競合を考慮したチップマルチプロセッサ向けプロセススケジューリング(セッション4:マルチコア向けシステムソフトウェア)
- 性能予測モデルの学習と実行時性能最適化機構を有する省電力化スケジューラ(省電力方式)
- 走行時パワーゲーティングのための命令実行制御手法の検討(命令実行制御,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- Etheretによるクラスタ上での分散共有メモリOpenMP Omni/SCASHの性能評価
- 超並列計算機CP-PACSにおけるPVMの実装
- CP-PACSパイロットモデルにおけるLINPACKベンチマークの高速化
- CP-PACSパイロットモデルにおけるNAS並列ベンチマークの評価
- 超並列計算機CP-PACSにおけるNAS-PBの仮想評価
- 超並列計算機用多段結合網における転送性能の解析 (並列処理)
- ハイパクロスバ・ネットワークにおける転送性能向上のための手法とその評価
- ハイパクロスバ・ネットワークのスループットの理論的解析
- ハイパクロスバ網における適応ルーチングの導入とその評価
- ハイパクロスバ・ネットワークの転送性能の解析
- ハイパクロスバ・ネットワークにおけるバッファの利用法と転送性能について
- ハイパクロスバ・ネットワークにおけるバーチャル・カット・スルーの性能評価
- 超低電力メガスケールシステムのプロトタイプ : MegaProto(高性能システム)
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 超並列相互結合網におけるバッファ制御方式の改良
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- VHDLによるハイパクロスバ網用ルータ・チップの設計
- プロセッサの消費電力測定と低消費電力プロセッサによるクラスタの検討(省電力)
- 低消費電力プロセッサによるクラスタの検討(ARC-6:低消費電力化)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- 超並列ネットワーク・シミュレータ生成系INSPIREにおけるネットワーク記述検証システムの実装
- ハイパクロスバ網における迂回ルーティング・アルゴリズムに関する研究
- 並列処理ネットワークのための性能評価用シミュレータ生成系INSPIRE
- NASPB CG, FTにおけるSCIMAの性能評価
- 超並列計算機CP-PACSにおけるNPB Kernel CGの評価(並列処理)
- 超並列計算機CP-PACSのネットワーク性能評価
- 超並列計算機CP-PACSの基本性能評価
- 方式レベル記述言語AIDLを用いた高性能プロセッサ設計支援
- 擬似ベクトルプロセッサにおける高速リストベクトル処理
- 超並列計算機CP-PACSのCGベンチマークによる性能評価
- 並列計算機の仮想性能評価システムVIPPES
- ハイパクロスバ・ネットワークにおけるVirtual Channelの動的選択による適応ルーティング
- 2. 超並列計算機 CP-PACS のアーキテクチャ ( 計算物理学と超並列計算機 : CP-PACS計画)
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 超並列計算機のためのCommodity Networkに基づく並列入出力・可視化システム
- CP-PACSのアーキテクチャの概要
- P2P分散システムXtremWeb上でのGrid RPCシステムOmniRPCの設計(HPC-7 : グリッド(2))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- University of California, Department of Applied Science at Lawrence Livermore National Laboratory訪問記(海外,ラボラトリーズ)
- It's still the Bandwidth!
- これでいいのか?日本のスパコン
- CONFLEX-G : OmniRPCによるグリッド環境上での分子立体配座探索プログラムの実装と性能評価(グリッド応用)
- OmniRPCによる広域ネットワーク環境でのグリッドアプリケーションの性能評価(HPC-5 : グリット(1))(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 分散メモリ型並列計算機における並列入出力システム
- スライドウィンドウ方式による擬似ベクトルプロセッサ
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサ
- 擬似ベクトルプロセッサによるリストベクトル処理
- ハイパークロス網の拡張について
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化(数値計算)
- MPI上のソフトウェア分散共有メモリシステム(並列処理のためのシステム)
- Omni/SCASHおけるFirst Touch page allocation の実装(ARC-9:ハイパフォーマンスコンピューティング)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 高バンド幅/耐故障性を持つクラスタ向けネットワークRI2Nの性能評価(HPC-4 : ネットワーク)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- ユーザレベルでのマルチリンク利用による高バンド幅/耐故障性を持つクラスタ向け結合ネットワークRI2N
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化
- ItaniumプロセッサによるSCoreクラスタ構築に関する検討(高性能計算及び一般)
- SMP-PCクラスタにおけるSPAM粒子シミュレーションのハイブリッド並列化
- PCクラスタにおける並列一次元FFTのブロックアルゴリズム
- SR8000におけるOpenMPベンチマーク
- SR8000におけるOpenMPベンチマーク
- ハイパフォーマンスコンピューティング向けアーキテクチャSCIMA
- マルチバンクメモリ上における擬似ベクトルプロセッサPVP-SWの性能評価
- 擬似ベクトルプロセッサPVP-SWのシミュレーション評価
- PVP-SWとハイパクロスバ・ネットワークを用いた計算機の評価
- ハイパクロスバ・ネットワークにおけるNASベンチマークの評価
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサの評価
- ハードウェア記述言語によるsuperscalar及びVLIWプロセッサの設計とその比較
- 方式レベル記述言語AIDLの改良
- 2000-HPC-82-31 汎用可視化ツールAVS/Expressの並列化とその性能評価
- 並列入出力機構を用いた可視化システムの提案
- 超並列計算機CP-PACSにおける大規模分子動力学法シミュレーション (並列処理)
- CP-PACSにおける空間分割法による分子動力学法シミュレーション
- ハイパクロスバ・ネットワークにおける適応ルーティングの実現方法とその評価
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- SPAM粒子シミュレーションコードのハイブリッド並列化
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- 大規模並列処理ネットワークにおけるランダム転送性能の評価
- HPC向けプロセッサのメモリ・アーキテクチャの基本構成
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- ハイパクロスバ・ネットワークの性能評価
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- ハイパクロスバ ・ネットワークにおける並列ソート処理