ALU Cascadingを行う動的命令スケジューラ(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)

概要

論文の詳細を見る
ALUの出力を別のALUの入力につなぎ,1クロック・サイクル中にデータ依存関係にある命令列を複数実行する,ALU Cascadingという手法がある.この手法をスーパスカラ・プロセッサに適用する場合,ALU Cascading可能な組を同時にwakeup可能な命令スケジューラが必要となる.本論文では,このALU Cascadingを行える命令スケジューラについて提案を行う.提案する命令スケジューラをSPECint95を用いて評価した結果,2段のALU Cascadingを行うと,IPCが平均で6.6%向上するという結果になった.
一般社団法人情報処理学会の論文
2007-05-31

著者

嶋田創
奈良先端科学技術大学院大学情報科学研究科
富田眞治
京都大学物質-細胞統合システム拠点
富田眞治
京都大学大学院情報学研究科
三輪忍
京都大学
三輪忍
京都大学大学院情報学研究科
嶋田創
京都大学大学院情報学研究科
富田眞治
京都大学工学部情報工学科
尾形幸亮
三菱電機株式会社情報技術総合研究所
姚駿
京都大学大学院情報学研究科:京都大学大学院法学研究科
Tomita S
Graduate School Of Informatics Kyoto Univ.
Tomita Shinji
Kyoto Univ. Kyoto‐shi Jpn
尾形幸亮
京都大学大学院情報学研究科
尾形幸亮
京都大学大学院情報学研究科:京都大学大学院法学研究科

関連論文

インタラクティブ・スーパーコンピューティング環境の実現に向けて
並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装)
並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装,FPGA応用及び一般)
操作の連続性を考慮した手術シミュレータの高速化手法(HPC-8 : アプリケーションII)
インタラクティブシミュレーションにおける遠隔操作フレームワークの実装(HPC-6 : 開発・実行環境)
パス情報を用いた分岐フィルタ機構(プロセッサアーキテクチャ)
スラック予測を用いたクラスタ型スーパースカラ・プロセッサ向け命令ステアリング(ARC-4:スケジューリング,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
セル投影型並列ボリュームレンダリングのEarly Ray Terminationによる高速化(並列計算)
中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング
大規模パイプラインステージ統合 : CPU内部からチップセットまで(一般セッションE Funny Architecture I)
並列事前実行における再利用バッファの高速化(一般セッションC 設計と実装)
(2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画)
150回研究会記念特別企画(2)パネル討論 : アーキテクチャ研究の将来
コンテキスト・ベース値予測を利用した分岐先予測器(マイクロアーキテクチャ,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
分散OS Coloniaにおける共有メモリを利用した大域的ネーム・サービス
コンピュータ・コロニーを実現する高速通信機構
コンピュータコロニーにおける高速移送可能な並列アクティビティの実現
並列アプリケーションを指向した分散システムコンピュータ・コロニーの構想
共有メモリベースのシームレスな並列計算機環境を実現するオペレーティングシステムの構想
並列化コンパイラTINPARにおける自動データ分割決定手法
非均質環境向け並列化コンパイラhetero-TINPER : 動的負荷分散方式の改良
並列化コンパイラTINPARによる非均質計算環境向けコード生成手法
並列化コンパイラTINPARにおける重複プロセッサ間通信の削減手法
並列化コンパイラTINPARにおける自動データ分割部の実現
並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
小容量RAMを用いたオペランド・バイパスの複雑さの低減手法(プロセッサアーキテクチャ)
グローバル分岐履歴を用いたスラック予測器(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
Javaと専用マイコンボードを用いた分散型ハードウェア実験教育システムの構築
計算機教育支援ビジュアルシミュレータVisuSimを用いた教育効果と課題について
ハードウェアとソフトウェアを融合した情報システム工学実験の実施状況と評価
遠隔教育への対応を目指したアセンブリプログラミング教育支援システム
計算機教育支援ビジュアルシミュレータVisuSimの改良と遠隔教育への適応 : Java Swingライブラリ利用,メイルハンドラ組込み等の改善策とその応用について
Javaアプレットによる計算機ビジュアルシミュレータの実現
計算機システム教育のためのビジュアルシミュレータVisuSim
WWWベース情報共有システムのプログラミング教育への適用
計算機の構造・動作の理解を目的としたビジュアルシミュレータ
汎用グラフィクスハードウェアを用いた並列ボリュームレンダリングの実装(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
J-16 サイクリックにデータを配置した並列ボリュームレンダリング処理におけるERTの効果(レンダリングと自然物,J.グラフィクス・画像)
汎用グラフィクスカードを用いた格子ボルツマン法による流体シミュレーション
DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング
KLICにおけるゴール・スケジューリング最適化
参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズムの改良(並列処理応用)
フロントエンド実行によるプリロードの提案(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
行列に基づくOut-of-Orderスケジューリング方式の評価
直接依存行列型スケジューリングを適用したクラスタ化スーパースケーラ・プロセッサの評価
並列計算機JUMP-1の性能評価
超並列計算機JUMP-1のマルチキャスト機構による性能向上
2000-ARC-139-4 並列計算機JUMP-1における分散共有メモリシステムの性能評価
超並列計算機JUMP-1における分散共有メモリ管理の実装とその評価
D-10-6 プログラム・カウンタを利用した命令語へのパリティ付加(D-10.ディペンダブルコンピューティング,一般セッション)
メモリ・アクセスの局所性を最適化するループ再構成法
メモリ・アクセスの局所性を最適化するループ再構成法
メモリ・アクセスの局所性を最適化するループ再構成法
低レベル並列処理計算機による3次元図形表示処理 : 視線探索法の場合
ユニバーサル・ホスト計算機QA-2による逐次型Prologマシンのエミュレーション
低レベル並列処理計算機による3次元色彩図形表示処理
共有メモリベースのシームレスな並列計算機環境を実現するオペレーティングシステムの構想
超並列計算機JUMP-1のクラスタの実装及び予備的性能評価
超並列計算機プロトタイプJUMP-0.5における分散共有メモリ管理手法
少品種高信頼セルを用いた高信頼回路設計手法と信頼性評価手法の提案
少品種高信頼セルを用いた高信頼回路設計手法と信頼性評価手法の提案
少品種高信頼セルを用いた高信頼回路設計手法と信頼性評価手法の提案
少品種高信頼セルを用いた高信頼回路設計手法と信頼性評価手法の提案
少品種高信頼セルを用いた高信頼回路設計手法と信頼性評価手法の提案
少品種高信頼セルを用いた高信頼回路設計手法と信頼性評価手法の提案
少品種高信頼セルを用いた高信頼回路設計手法と信頼性評価手法の提案
情報処理学会の未来に向けての若い世代からの論断
命令畳み込み, データ投機および再利用技術を用いたJava仮想マシンの高速化
距離画像生成処理におけるメディアプロセッサの評価(メディアプロセッサ)
ステレオ画像処理を用いた曖昧再利用の評価(画像処理における再利用)
An EDP Study on the Optimal Pipeline Depth for Pipeline Stage Unification Adoption
A Dynamic Control Mechanism for Pipeline Stage Unification by Identifying Program Phases
Dynamic Control Mechanisms for Pipeline Stage Unification Based on Program Phase Detection
Dynamic Control Mechanisms for Pipeline Stage Unification Based on Program Phase Detection(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装,FPGA応用及び一般)
並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装,FPGA応用及び一般)
故障に対してユーザ側の耐性を高めるデジタル家電アーキテクチャ(Inventive and Creative Architecture特別セッションII)
ALU Cascadingを行う動的命令スケジューラ(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
ALU Cascadingを行う動的命令スケジューラ(低消費電力化技術(2),集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
配線層内トランジスタを利用した3次元実装プロセッサ・アーキテクチャの検討
ビット・ベクタを利用した選択的命令再発行機構(ARC-4 : アーキテクチャII,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
大規模ボリュームレンダリング処理における擬似透視投影法に関する考察
汎用GPUを用いた大規模可視化クラスタの構築
スーパースケーラのための高速な動的命令スケジューリング方式
並列ボリュームレンダリングにおける投機的描画に関する考察(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
スーパースケーラのための高速な命令スケジューリング方式のIPCの評価
日本の計算機アーキテクチャ研究の将来((2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画))
R.M.Tomasulo : An Efficient Algorithm for Exploiting Multiple Arithmetic Units (20世紀の名著名論)
大学における情報教育環境の整備(情報技術の新時代に向けて)
数値シミュレーション過程の実時間可視化を支援するハードウェア
ReVolver/C40を用いた時系列ボリュームデータの実時間可視化
演算器アレイ割り当て型スーパスカラ実行の効率向上検討

ALU Cascadingを行う動的命令スケジューラ(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク