並列事前実行における再利用表管理機構の改良(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
スポンサーリンク
概要
- 論文の詳細を見る
我々は, 再利用に並列事前実行を組み合わせた, 非対称な投機的マルチスレッディング機構を提案している.この並列事前実行の問題点として, 実行結果を保存する再利用表に大容量CAMが必要であり, 実装が困難であることや検索オーバヘッドが大きいことが挙げられる.そのため, 再利用表をより有効に活用することで, 再利用表の必要容量を削減することが望まれる.本稿では, 再利用表の追い出し規則を改良して有効なエントリの残存率を高くすることで, 必要CAM容量を削減する手法を提案する.具体的には, 命令区間毎の削減サイクル数を求め, 削減サイクル数の大きいものの追い出しを抑止する手法を考案した.SPEC95のpcrlを用いた評価では, 128KBのCAMを用いた場合のサイクル削減率が13%から23%に向上し, 従来法での512KBのCAMと同等の結果が得られた.
- 一般社団法人情報処理学会の論文
- 2005-08-03
著者
-
中島 康彦
京都大学大学院経済学研究科
-
中島 浩
豊橋技術科学大学
-
津邑 公暁
豊橋技術科学大学
-
池内 康樹
豊橋技術科学大学
-
鈴木 郁真
豊橋技術科学大学
-
池内 康樹
豊橋技術科学大学:(現)(株)access
-
鈴木 郁真
豊橋技術科学大学:(現)トヨタ自動車(株)
-
中島 康彦
京都大学/科学技術振興機構さきがけ研究21
関連論文
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- セル投影型並列ボリュームレンダリングのEarly Ray Terminationによる高速化(並列計算)
- 中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング
- 大規模パイプラインステージ統合 : CPU内部からチップセットまで(一般セッションE Funny Architecture I)
- 並列事前実行における再利用バッファの高速化(一般セッションC 設計と実装)
- (2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画)
- 150回研究会記念特別企画(2)パネル討論 : アーキテクチャ研究の将来
- specMEM : 同期操作に対するメモリ・アクセスの投機的実行機構
- 同期操作に対するメモリ・アクセスの投機的実行の評価
- 同期操作に対するメモリアクセスの投機的実行の提案
- 高性能計算のための低電力・高密度クラスタMegaProto(HPCハードウェア)
- 高性能計算のための低電力・高密度クラスタMegaProto(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 高性能計算のための低電力・高密度クラスタ MegaProto
- 超低電力メガスケールシステムのプロトタイプ : MegaProto(高性能システム)
- 超低電力メガスケールシステムのプロトタイプ : MegaProto
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- タスク並列スクリプト言語処理系におけるユーザレベル機能拡張機構(分散コンピューティング)
- グローバル分岐履歴を用いたスラック予測器(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 汎用グラフィクスカードを用いた並列ボリュームレンダリングシステム(並列処理応用)
- 汎用グラフィクスハードウェアを用いた並列ボリュームレンダリングの実装(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- J-16 サイクリックにデータを配置した並列ボリュームレンダリング処理におけるERTの効果(レンダリングと自然物,J.グラフィクス・画像)
- 汎用グラフィクスカードを用いた格子ボルツマン法による流体シミュレーション
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズムの改良(並列処理応用)
- フロントエンド実行によるプリロードの提案(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- フロントエンド実行(マルチスレッド実行とプロセッサアーキテクチャ)
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズム(キャッシュの効率的利用)
- 行列に基づくOut-of-Orderスケジューリング方式の評価
- 直接依存行列型スケジューリングを適用したクラスタ化スーパースケーラ・プロセッサの評価
- タスクネットワークの解析情報を用いたスケジューリング手法
- 重複実行省略を用いた割込みによるマイクロプロセッサの最悪性能予測(プロセッサアーキテクチャ)
- 時間軸分割並列マイクロプロセッサシミュレータの高速化手法(ARC-8:シミュレーション技法,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 分岐予測器の最悪フラッシュタイミングの効率的解析手法(セッション1)
- 再利用における連想記憶の必要容量および管理アルゴリズムの評価(最適化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 時分割マイクロプロセッサシミュレーションにおける最適な分割数の調査(最適化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 再利用における連想記憶の必要容量および管理アルゴリズムの評価(最適化, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 時分割マイクロプロセッサシミュレーションにおける最適な分割数の調査(最適化, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 超並列計算機プロトタイプJUMP-0.5における分散共有メモリ管理手法
- LinuxとITRONによるハイブリッドOSの設計と実装(実時間処理,組込システム及び一般)
- 命令畳み込み, データ投機および再利用技術を用いたJava仮想マシンの高速化
- 命令畳み込み, データ投機および再利用技術を用いたJava仮想マシンの高速化
- 命令畳み込み, データ投機および再利用技術を用いたJava仮想マシンの高速化
- 距離画像生成処理におけるメディアプロセッサの評価(メディアプロセッサ)
- ステレオ画像処理を用いた曖昧再利用の評価(画像処理における再利用)
- メガスケールシミュレータAnastasiaにおける高精度タスクモデルシミュレーション(HPC-3 : クラスタソフトウェア)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- メガスケール環境シミュレータAnastasiaにおける詳細シミュレーション(HPC-10 :クラスタソフトウェア)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 時間軸分割並列化による高速マイクロプロセッサシミュレーション(プロセッサシミュレーション)
- 高性能マイクロプロセッサシミュレータの並列化による高速化(ARC-6 : シミュレーション技法)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 高性能マイクロプロセッサシミュレータの並列化による高速化の構想(アーキテクチャ一般及びチップマルチプロセッサ)(デザインガイア2003 : VLSI設計の新しい大地を考える研究会)
- タスク並列スクリプト言語処理系における広域分散実行方式
- 効率の良い広域分散対応のタスク並列スクリプト言語の実現(HPC-9: 並列プログラミング)
- 分散計算システムWDC用基本ライブラリの構築
- 2000-HPC-82-25 分散計算システムWDCの設計と実装
- CASによる最悪割込遅延解析の高速化(ARC-7:性能予測,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- ワークロード最適化シミュレータの設計と実装(プロセッサシミュレーション)
- ワークロード最適化によるキャッシュシミュレータの高速化(ARC-6: キャッシュ・システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 割込みによるマイクロプロセッサの最悪性能予測(ARC-5: 性能予測, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 共有メモリ型並列計算機の分散シミュレータの設計(ARC-6 : シミュレーション技法)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 割込みによるマイクロプロセッサの性能劣化の予測方式(ARC-6 : シミュレーション技法)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 高速マイクロプロセッサシミュレータBurstScalarの設計と実装(シミュレータ)
- 動的計画法を用いたキャッシュフラッシュの最悪タイミングの探索手法(実時間処理)
- LinuxとITRONによるハイブリッドOSの設計と実装(実時間処理,組込システム及び一般)
- SpecCによるソフトウェア記述の実装記述への変換(仕様記述による実装)
- 関数値再利用および並列事前実行による高速化技術
- 関数値再利用および並列事前実行による高速化技術の提案と評価
- 関数値再利用および並列事前実行による高速化技術の提案と評価
- 汎用グラフィクスカードを用いた格子ボルツマン法による流体シミュレーション(プロセッサアーキテクチャと応用)
- 再利用によるGAの高速化手法(計算科学)
- 共有メモリ・マルチプロセッサの分散シミュレーションのための参照フィルタ方式
- タスク並列スクリプト言語MegaScriptのタスク動作モデルの検証
- 動的負荷分散機能を備えたセル投影型並列ボリュームレンダリングシステムの実装
- 大規模ボリュームレンダリング処理における擬似透視投影法に関する考察
- 高性能マイクロプロセッサの高速シミュレータの設計と実装(ARC-2:シミュレーション技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- データ再演法による並列プログラムデバッギング(プログラミングモデル・ツール)
- 巻き戻し実行をサポートする並列プログラムデバッガ
- 並列プログラムデバッギングのための巻き戻し実行機構
- 汎用GPUを用いた大規模可視化クラスタの構築
- タスク並列言語MegaScriptにおける高精度実行モデルの構築(プログラミングモデル・ツール)
- タスク並列スクリプト言語処理系におけるユーザレベルの機能拡張を可能とする機構(HPC-9: 並列プログラミング)
- スーパースケーラのための高速な動的命令スケジューリング方式
- 並列ボリュームレンダリングにおける投機的描画に関する考察(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 汎用グラフィクスカード上での簡易シミュレーションと可視化(CPSY-6 並列分散プラットホーム)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- スーパースケーラのための高速な命令スケジューリング方式のIPCの評価
- 2000-ARC-139-29 投機的手法を用いたデータ再利用によるJava仮想マシンの高速化
- 数値シミュレーション過程の実時間可視化を支援するハードウェア
- ReVolver/C40を用いた時系列ボリュームデータの実時間可視化
- アクティブボリュームレンダリングに基づくシミュレーションステアリング
- 並列事前実行における再利用表管理機構の改良(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 再利用を用いたGAの高速化(科学技術計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 再利用を用いたGAの高速化
- 低電力Javeプロセッサのための投機的クロック制御
- 低電力化のための投機的クロック供給制御
- 低電力化のための投機的クロック供給制御