再利用における連想記憶の必要容量および管理アルゴリズムの評価(最適化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
スポンサーリンク
概要
- 論文の詳細を見る
我々は,命令レベル並列性に依存しない再利用を用いた高速化手法を提案している.再利用機構には,再利用表が大きくなるにつれ検索等のオーバーヘッドが大きくなり,再利用による効果が低減されてしまうという問題が存在する.よって,再利用表の必要容量を削減しつつ再利用の効果を上げる必要があり,このためには効果的な再利用表の管理アルゴリズムが不可欠である.本稿では,再利用表の管理アルゴリズムを改善するにあたり,現在の再利用表機構の評価を行った.まず,再利用表が無限大であると仮定した場合の理想的な性能を算出し,現在の再利用機構による効果との比較を行う.また,理想的には再利用されるはずの入出力セットに対し,それが再利用機構において再利用されなかった原因を調査・分類し,再利用表管理アルゴリズム改良に向けての展望を示す.Stanford, mediabench, SPEC CPU95を用いて評価した結果,いくつかのプログラムにおいて再利用表が有効に活用できていないことが分かり,特にLRUに基づくエントリ削除に改善の余地があることを示唆する結果が得られた.
- 2006-02-27
著者
-
中島 康彦
京都大学大学院経済学研究科
-
中島 浩
京都大学学術情報メディアセンター
-
中島 浩
豊橋技術科学大学
-
津邑 公暁
名古屋工業大学
-
中島 康彦
奈良先端科学技術大学院大学
-
津邑 公暁
豊橋技術科学大学
-
池内 康樹
豊橋技術科学大学
-
鈴木 郁真
豊橋技術科学大学
-
池内 康樹
豊橋技術科学大学:(現)(株)access
-
鈴木 郁真
豊橋技術科学大学:(現)トヨタ自動車(株)
-
中島 康彦
京都大学/科学技術振興機構さきがけ研究21
関連論文
- 非均質環境における適応型スケジューリング手法の提案と評価(並列分散処理,情報爆発論文)
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- セル投影型並列ボリュームレンダリングのEarly Ray Terminationによる高速化(並列計算)
- 中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング
- 大規模パイプラインステージ統合 : CPU内部からチップセットまで(一般セッションE Funny Architecture I)
- 並列事前実行における再利用バッファの高速化(一般セッションC 設計と実装)
- シームレスな高生産並列スクリプト言語の実現に向けて(並列プログラミング/スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- シームレスな高生産並列スクリプト言語の実現に向けて (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- タスク並列スクリプト言語のビジュアル開発環境の構築(HPC-6 : 開発・実行環境)
- 非均質環境における適応型スケジューリング手法の提案と評価
- 高性能計算のための低電力・高密度クラスタMegaProto(HPCハードウェア)
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- タスク並列スクリプト言語処理系におけるユーザレベル機能拡張機構(分散コンピューティング)
- シームレスな高生産並列スクリプト言語の実現に向けて(並列プログラミング/スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 並列デバッガにおける情報視覚化手法
- グローバル分岐履歴を用いたスラック予測器(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 非均質環境における選択型スケジューリング手法
- キャッシュメモリを考慮したFDTDカーネルの性能改善
- 大規模ワークフローを対象とする動的スケジューリング手法における静的情報の利用
- 負荷分散技法OhHelpによる粒子・流体ハイブリッドプラズマシミュレーションの並列化
- 汎用グラフィクスカードを用いた並列ボリュームレンダリングシステム(並列処理応用)
- 汎用グラフィクスハードウェアを用いた並列ボリュームレンダリングの実装(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- J-16 サイクリックにデータを配置した並列ボリュームレンダリング処理におけるERTの効果(レンダリングと自然物,J.グラフィクス・画像)
- 汎用グラフィクスカードを用いた格子ボルツマン法による流体シミュレーション
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング
- モデル図とコードを併用する大規模並列プログラミングの支援環境
- ヘテロ型大規模並列環境の階層型タスクスケジューリングの提案と評価
- 4K-1 配列の縮退表現による大規模並列タスクネットワークの実装効率化(情報爆発時代における分散処理とセキュリティ,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズムの改良(並列処理応用)
- フロントエンド実行によるプリロードの提案(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- フロントエンド実行(マルチスレッド実行とプロセッサアーキテクチャ)
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズム(キャッシュの効率的利用)
- 行列に基づくOut-of-Orderスケジューリング方式の評価
- 直接依存行列型スケジューリングを適用したクラスタ化スーパースケーラ・プロセッサの評価
- 代数ブロック化多色順序付け法による並列化ICCGソルバの性能評価
- 不均質環境におけるタスクネットワークの静的スケジューリング手法(HPC-3 : スケジューリング)
- タスクネットワークの解析情報を用いたスケジューリング手法
- 直方体要素用高速多重極法を用いた大規模マイクロマグネティックス計算の並列化
- Localized IC分解と多色順序付けを併用したハイブリッド型並列ICCG法に関する検討
- 自動メモ化プロセッサにおける消費エネルギー制御
- LC-005 自動メモ化プロセッサの消費エネルギー評価(ハードウェア・アーキテクチャ)
- 重複実行省略を用いた割込みによるマイクロプロセッサの最悪性能予測(プロセッサアーキテクチャ)
- 時間軸分割並列マイクロプロセッサシミュレータの高速化手法(ARC-8:シミュレーション技法,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 分岐予測器の最悪フラッシュタイミングの効率的解析手法(セッション1)
- 再利用における連想記憶の必要容量および管理アルゴリズムの評価(最適化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 時分割マイクロプロセッサシミュレーションにおける最適な分割数の調査(最適化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 再利用における連想記憶の必要容量および管理アルゴリズムの評価(最適化, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 時分割マイクロプロセッサシミュレーションにおける最適な分割数の調査(最適化, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 6K-5 広域分散環境における大規模タスク群の挙動を求める高速シミュレータ(情報爆発時代における並列分散処理技術,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 命令畳み込み, データ投機および再利用技術を用いたJava仮想マシンの高速化
- 命令畳み込み, データ投機および再利用技術を用いたJava仮想マシンの高速化
- 命令畳み込み, データ投機および再利用技術を用いたJava仮想マシンの高速化
- 距離画像生成処理におけるメディアプロセッサの評価(メディアプロセッサ)
- ステレオ画像処理を用いた曖昧再利用の評価(画像処理における再利用)
- 時間軸分割並列マイクロプロセッサシミュレータの高速化と評価(シミュレーション・エミュレーション,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 時間軸分割並列マイクロプロセッサシミュレータの高速化と評価(シミュレーション・エミュレーション,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 時間軸分割並列化による高速マイクロプロセッサシミュレーション(プロセッサシミュレーション)
- T2Kオープンスパコンが創る新しい計算機環境
- タスク並列スクリプト言語処理系における広域分散実行方式
- 負荷分散技法 OhHelp による粒子・流体ハイブリッドプラズマシミュレーションの並列化
- 非数値並列計算の動向と展望(論理と推論技術の展開)
- T2Kオープンスパコンとその相互結合網アーキテクチャ(分散システム,コンピュータシステムのインタコネクト技術及び一般)
- 少しは組込的なアーキテクチャシミュレーション : 色々やってわかったこと(招待講演)
- 少しは組込的なアーキテクチャシミュレーション : 色々やってわかったこと(招待講演)
- 少しは組込的なアーキテクチャシミュレーション : 色々やってわかったこと
- 少しは組込的なアーキテクチャシミュレーション--色々やってわかったこと
- CASによる最悪割込遅延解析の高速化(ARC-7:性能予測,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- ワークロード最適化シミュレータの設計と実装(プロセッサシミュレーション)
- 動的計画法を用いたキャッシュフラッシュの最悪タイミングの探索手法(実時間処理)
- 関数値再利用および並列事前実行による高速化技術
- 関数値再利用および並列事前実行による高速化技術の提案と評価
- 関数値再利用および並列事前実行による高速化技術の提案と評価
- 汎用グラフィクスカードを用いた格子ボルツマン法による流体シミュレーション(プロセッサアーキテクチャと応用)
- 再利用によるGAの高速化手法(計算科学)
- タスク並列スクリプト言語MegaScriptのタスク動作モデルの検証
- 動的負荷分散機能を備えたセル投影型並列ボリュームレンダリングシステムの実装
- 大規模ボリュームレンダリング処理における擬似透視投影法に関する考察
- 第16回 若手が動かす学会へ : 事例研究と将来展望(これからの情報処理学会)
- 汎用GPUを用いた大規模可視化クラスタの構築
- スーパースケーラのための高速な動的命令スケジューリング方式
- 並列ボリュームレンダリングにおける投機的描画に関する考察(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 汎用グラフィクスカード上での簡易シミュレーションと可視化(CPSY-6 並列分散プラットホーム)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- スーパースケーラのための高速な命令スケジューリング方式のIPCの評価
- 2000-ARC-139-29 投機的手法を用いたデータ再利用によるJava仮想マシンの高速化
- 数値シミュレーション過程の実時間可視化を支援するハードウェア
- ReVolver/C40を用いた時系列ボリュームデータの実時間可視化
- アクティブボリュームレンダリングに基づくシミュレーションステアリング
- 並列事前実行における再利用表管理機構の改良(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 再利用を用いたGAの高速化(科学技術計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 再利用を用いたGAの高速化
- 低電力Javeプロセッサのための投機的クロック制御
- 低電力化のための投機的クロック供給制御
- 低電力化のための投機的クロック供給制御