クラスタ型データパスによるスーパースカラプロセッサの低消費電力化(プロセッサアーキテクチャ)
スポンサーリンク
概要
- 論文の詳細を見る
スーパースカラ方式プロセッサの広域的なデータパスを複数の局所性を持つ処理要素(PE)に分割してクラスタ化することにより,低消費電力で高並列な処理が可能である.しかしながら,データパスを分割する度合いを増すにつれて,局所化された処理要素間の通信や負荷不均衡により高並列なPEが効果的に活用できないため,結果的にクラスタ化を行わない場合と比べて性能が低下する恐れがある.本論文では,クラスタ型スーパースカラプロセッサの利点である低消費電力性をさらに引き出すために,クラスタ化を進めた場合のIPCの低下を抑える手法を提案する.局所化された処理要素を効率良く利用するために,プログラムに内在する命令の逐次性に着目する.プログラムの逐次性の指標としてプログラム実行時のオペランドの状態とレジスタファンアウトを利用してプログラムの逐次性をクラスタ型プロセッサの局所的処理に対応させる.さらに,局所化された高並列な処理要素を有効利用するために隣接するPEにおいて協調処理を行うことを提案する.実行駆動シミュレーションを実施した結果,隣接PEの協調を行うことにより,高並列な処理要素を効率良く利用しつつ,レジスタファイルの消費電力をクラスタ化を行わない場合と比べて12分の1程度に削減可能であることが分かった.
- 一般社団法人情報処理学会の論文
- 2007-08-15
著者
-
中村 維男
東北大学大学院情報科学研究科情報基礎科学専攻
-
鈴木 健一
東北工業大学
-
中村 維男
東北大学大学院情報科学研究科
-
佐藤 幸紀
北陸先端科学技術大学院大学情報科学センター
-
鈴木 健一
東北大学大学院情報科学研究科
-
中村 維男
東北大
-
佐藤 幸紀
東北大学大学院情報科学研究科
-
中村 維男
東京工業大学
関連論文
- 暗号VLSIプロセッサのための固有電力消費アーキテクチャ
- 細粒度電力制御Cooled logic アーキテクチャ
- ニューラルネットワーク(クロストークリンク付きBPD)のFSK復調への応用
- SOUNDコンピュータの試作
- ディレー付きニューラルネットワークを用いた符号化・復号化
- ディレー素子内包型バックプロパゲーションニューラルネットワーク(BPD)の一構成
- パイプライン型Prologアーキテクチャにおける負荷分散の一検討
- 高速省電力ウェーブパイプライン用評価テスト回路の開発
- ウェーブパイプラインと従来方式パイプラインの性能評価
- Z^*_n中の原始元の簡略化した識別法について
- ベクトル量子化用コードブック生成のための並列弱肉強食アルゴリズムの性能解析
- LJ-11 視覚的画質劣化を抑制するベクトル量子化手法(J. グラフィクス・画像)
- ベクトル量子化のためのコードブック生成並列処理に関する研究
- ベクトル量子化のための並列コードブック生成アルゴリズムの性能評価(2.第1回情報シナジー研究会)
- 多層パーセプトロンの分類能力向上法に関する一検討
- ニューラルネットワークを利用した自動表情認識システム
- A-19-4 音声による計算機利用支援のための文字情報識別に関する一考察
- 3DCGiRAMアーキテクチャによる実時間レイトレーシングシステム
- MULHIキャッシュの設計及び評価
- D-11-73 レイトレーシングハードウェアのための交差判定器の計算精度に関する一考察
- VLIWアーキテクチャのためのダイナミックブースティング機構
- 投機的実行を行なうVLIWプロセッサの命令供給機構の設計
- 2ZC-7 参照画像を用いた光線追跡法の高速化に関する一検討(レンダリングとアニメーション,一般講演,インタフェース)
- 3M-1 興味部位の形状を考慮した動的輪郭モデル
- MULHIキャッシュ : VLIWプロセッサのための命令キャッシュ機構 (並列処理)
- 再構成可能な同期式データフロー計算機に関する一検討
- データ並列ボリュームレンダリングのためのボリューム適応分割手法
- ベクトル命令とスカラ命令を融合した命令レベル並列処理のためのスケジューリング手法
- 乗算器の回路規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 乗算器の回野規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- K-032 損失データ再送および属性限定受信に対応した映像配信システム(K分野:ヒューマンコミュニケーション&インタラクション)
- N-027 対話型映像再生に対応した業務用映像配信システム(N分野:教育・人文科学)
- リアルタイム・ビジュアル・デザインレビュー・システムの設計と実装(ハードウエアによるCG処理およびCG一般)
- 再構成可能な同期式データフロー計算機に関する一検討
- 再構成可能な同期式データフロー計算機に関する一検討
- TLB統一型キャッシュのためのタイムスタンプ無効化方式とその性能評価
- RICEによる2次キャッシュメモリの性能評価
- TLB-Assisted Cache
- ウェーブパイプラインを用いた時分割擬似マルチポートレジスタファイル (非同期式回路/システム設計論文小特集)
- 分散フレームバッファシステムを持つ画像生成用超並列処理システム(Mπ)^2の性能評価
- ハードウェアキャッシュ評価システム "RICE"
- 並列グラフ簡約システムにおけるタスク割当て手法とメモリ参照局所性評価
- ジェットパイプラインの並列化命令スケジューリングに関する一検討
- 分散共有メモリ型並列計算機のためのメッセージ損失を許容するメモリアクセスプロトコル
- データの更新をバイト単位で管理するキャッシュメモリ
- プロセッサクラスタ用メモリアクセスバッファリング機構
- メッセージロスのあるネットワークを用いた分散共有メモリマルチプロセッサシステムの評価
- FL階層化並列簡約システムの共有メモリシステム
- Wave-Pipeliningを用いた時分割擬似マルチポートレジスタファイル
- ジェットパイプラインのためのコンパイル技術に関する一検討
- FL階層化並列簡約システムの性能評価
- ニューラルネットワークを用いた自動感情認識に関する一検討
- ATMネットワークを用いた分散処理システムにおけるメモリアクセスプロトコル
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- 乗算器の回路規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 乗算器の回路規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- LC-008 マイクロプロセッサにおける細粒度発熱解析の一手法(C分野:アーキテクチャ・ハードウェア)
- ベクトル量子化のためのコードブック生成専用プロセッサに関する研究
- ウェーブパイプライン方式ALUの性能評価
- ウェーブパイプラインと従来方式パイプラインの性能評価
- ウェーブパイプラインと従来方式パイプラインの性能評価
- 空間分割法に基づく高速コードブック生成アルゴリズムの提案と評価
- ジェットパイプラインのための命令スケジューリングに関する一検討
- ループ並列化のためのループ階層構造を検出する実行時プロファイリング手法(高性能計算とアクセラレータ)
- クラスタ型データパスによるスーパースカラプロセッサの低消費電力化(プロセッサアーキテクチャ)
- 命令の並列性と逐次性を利用したクラスタ型プロセッサの命令ステアリング方式(プロセッサアーキテクチャ)
- 命令の並列性と逐次性を利用したクラスタ型プロセッサの命令ステアリング方式
- 動画生成用レイトレーシングエンジン(プロセッサ, DSP, 画像処理技術及び一般)
- 動画生成用レイトレーシングエンジン(プロセッサ, DSP, 画像処理技術及び一般)
- 動画生成用レイトレーシングエンジン(プロセッサ, DSP, 画像処理技術及び一般)
- 動画生成用レイトレーシングエンジン(プロセッサ, DSP, 画像処理技術及び一般)
- イベント処理機構の改善に関する検討(インタフェース,入出力,その他)
- イベント処理機構の改善に関する検討(HAIにおけるコミュニケーションとインタラクション適応)
- ボリュームシェーディングに関する一考察
- リスト構造のフロア化に関するアルゴリズムとアーキテクチャ
- トランスピュータを用いた木構造汎用パイプライン
- クロストークリンク付きBPDの一検討
- ディレイ素子を内包するバックプロパゲーションニューラルネットワークの一構成
- 配線遅延を考慮したマルチスレッド方式アーキテクチャ : SHIFT Machineの提案
- 機械設計記述言語MODEL
- MMPDCLアルゴリズムに基づくコードブック生成専用プロセッサ(アーキテクチャ全般)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- Z^*_n中のある位数をもつ元の個数について
- 2元BCH符号における復号化アルゴリズム
- C-017 クラスタ化アーキテクチャにおける非重複分散レジスタファイルの評価(C分野:アーキテクチャ・ハードウェア)
- プログラムにおける命令の並列性と逐次性について(高速化手法)
- 単語の情緒的印象と心情モデルによる推論
- C-006 分散レジスタファイル向け静的命令スケジューリング(ハードウェア・アーキテクチャ,一般論文)
- TLBとキャッシュの統一的管理とその性能評価
- TLB とキャッシュメモリの統一的管理方式