キャッシュウェイ割り当てとコード配置の同時最適化によるメモリアクセスエネルギーの削減(プロセッサ,DSP,画像処理技術及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿ではシングルコアプロセッサで実行されるマルチタスクにおいて,キャッシュウェイの割り当てとコード配置を同時に最適化する手法の提案を行う.同時には一つの割り当てられたキャッシュウェイのみを活性化し,残りのキャッシュウェイは活性化しないことでセットアソシアティブキャッシュへのアクセスエネルギーを削減可能である.また,主記憶上のプログラムコードの配置位置を変えることでキャッシュミス数を削減する.キャッシュミス数を削減することで主記憶へのアクセスエネルギーを削減可能であると同時に,全実行時間の短縮が可能である.商用プロセッサを用いた実験によって本手法を適用したプロセッサシステムの評価を行い,手法適用前の場合と比較して最大で17%の消費エネルギーの削減を確認した.
- 2011-10-17
著者
-
井上 弘士
九州大学大学院システム情報科学研究院
-
井上 弘士
福岡大学工学部 電子情報工学科
-
Inoue K
Kyushu
-
井上 弘士
九大 大学院システム情報科学研究院
-
石原 亨
京都大学大学院情報学研究科
-
高田 純司
九州大学大学院システム情報科学府
-
井上 弘士
九州大学人学院システム情報科学研究院
-
石原 亨
京都大学大学院 情報学研究科
関連論文
- 演算/メモリ性能バランスを考慮したCMP向けオンチップ・メモリ貸与法の提案(マイクロプロセッサ)
- 情報社会を支えるディペンダブル・プロセッサ
- 科学技術計算を対象とした大規模再構成可能データパスの性能評価(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 片側通信を用いた並列フラグメント分子軌道計算プログラムの実装(HPC-5 : アプリケーションI)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- C-12-29 演算/メモリ性能のバランスを考慮したマルチコア実行方式(C-12.集積回路,一般セッション)
- チップマルチプロセッサにおけるメモリ負荷変動の定量的解析(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- C-12-32 演算器配列型アクセラレータの温度解析(C-12.集積回路,一般セッション)
- SRAM/DRAMハイブリッド・キャッシュにおける実行時動作モード決定法の提案
- 近似文字列照合プログラム実行の特徴解析と高速化に関する検討(解析・省電力,SWoPP2006)
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- NSIM:将来の大規模相互結合網を対象とした通信シミュレータの開発
- ジャスモン酸によって誘導されるピーマンのマメハモグリバエに対する抵抗性因子(第37回大会研究発表抄録)
- マルチコア向けオンチップメモリ貸与法における実行コード生成法の改善
- マルチコア向けオンチップメモリ貸与法における実行コード生成法の改善
- 温度制約を考慮した積層構造マルチコア・プロセッサの性能評価 (集積回路)
- C-12-31 命令フェッチ機構の共有に基づく低消費エネルギー化手法の提案(C-12.集積回路,一般セッション)
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 適応的ヘルパースレッド実行に基づくマルチコア向け演算/メモリ性能バランシング
- 3次元DRAM-プロセッサ積層実装を対象としたオンチップ・メモリ・アーキテクチャの提案と評価
- 適応的ヘルパースレッド実行に基づくマルチコア向け演算/メモリ性能バランシング
- 3次元DRAM-プロセッサ積層実装を対象としたオンチップ・メモリ・アーキテクチャの提案と評価
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- パケットペーシングを用いた最適全対全通信アルゴリズムのシミュレーション評価
- PSI-NSIM : 大規模並列システムの性能解析に向けた並列相互結合網シミュレータ(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 次世代スーパーコンピュータの設計開発に向けたシステム性能評価環境PSI-SIM(HPC-16 : 性能評価)
- 大規模並列システムの性能評価を目的としたプログラムコード抽象化技法(HPC-3 : スケジューリング)
- 演算/メモリ性能バランスを考慮したCMP向けオンチップ・メモリ貸与法の提案(マイクロプロセッサ)
- Cellプロセッサへの分子軌道法プログラムの実装と評価(HPC-6 : 並列アプリケーション)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信タイミングを考慮した衝突削減のためのMPIランク配置最適化技術(並列計算)
- 負荷ばらつきを考慮したMPIブロードキャスト通信の動的最適化に関する研究(HPC-11 : 通信I)
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- Proposal of a Desk-Side Supercomputer with Reconfigurable Data-Paths Using Rapid Single-Flux-Quantum Circuits
- Drowsyキャッシュにおけるモード切替アルゴリズムの評価(省電力アーキテクチャ)
- Improving Performance and Energy Saving in a Reconfigurable Processor via Accelerating Control Data Flow Graphs
- メモリアクセスの特徴を活用した高速かつ正確なメモリアーキテクチャ・シミュレーション法(プロセッサシミュレーション)
- メモリ・アーキテクチャ・ベンチマーキング手法の提案(2006年並列/分散/協調処理に関する『高知』サマー・ワークショップ(SWoPP高知2006))
- チップマルチプロセッサにおけるキャッシュメモリの特性解析(ARC-5:キャッシュ,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- C-022 データパス分割に基づく空間的冗長性を利用した高信頼プロセッサ(C.アーキテクチャ・ハードウェア)
- Developing an architecture for a single-flux quantum based reconfigurable accelerator (集積回路)
- Rapid Design Space Exploration of a Reconfigurable Instruction-Set Processor
- A Reconfigurable Functional Unit with Conditional Execution for Multi-Exit Custom Instructions
- Temperature-Aware Configurable Cache to Reduce Energy in Embedded Systems
- A hybrid design space exploration approach for a coarse-grained reconfigurable accelerator (システムLSI設計技術)
- A hybrid design space exploration approach for a coarse-grained reconfigurable accelerator (VLSI設計技術)
- A hybrid design space exploration approach for a coarse-grained reconfigurable accelerator (コンピュータシステム)
- A hybrid design space exploration approach for a coarse-grained reconfigurable accelerator (リコンフィギャラブルシステム)
- Custom Instructions with Multiple Exits : Generation and Execution
- A Reconfigurable Functional Unit for Adaptable Custom Instructions
- データ値の局所性を利用したライン共有キャッシュの提案
- パケットペーシングを用いた集団通信アルゴリズムのシミュレーション評価
- 稼働コア数制限に基づくマルチコア・プロセッサ性能向上手法の提案
- 温度を考慮した3次元積層LSI向け低消費エネルギーL2キャッシュの提案
- キャッシュウェイ割り当てとコード配置の同時最適化によるメモリアクセスエネルギーの削減
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討
- Custom Instructions with Multiple Exits: Generation and Execution
- C-027 マルチ・スレッド実行を前提としたキャッシュ・リーク削減アルゴリズムの評価(C.アーキテクチャ・ハードウェア)
- 3次元積層LSIはメインストリームになり得るか?(パネル討論,集積回路とアーキテクチャの協創〜3次元集積回路技術とアーキテクチャ〜)
- 温度制約を考慮した積層構造マルチコア・プロセッサの性能評価(3D-II,集積回路とアーキテクチャの協創〜3次元集積回路技術とアーキテクチャ〜)
- シミュレーション結果の再利用によるキャッシュ・ミス率予測技術
- C-026 キャッシュ・ミス頻発命令が性能に与える影響(C.アーキテクチャ・ハードウェア)
- オペランド再利用によるレジスタ・ファイルの低消費電力化
- キャッシュメモリ中の衰退ラインを利用したメモリ整合性検証の高速化(アーキテクチャ,SWoPP2006)
- 低消費電力メディア・アプリケーション向けヒストリ・ベース・タグ比較キャッシュの評価
- タグ比較結果の再利用によるキャッシュメモリの低消費電力化
- 組込みシステム向けメニーコア用OpenCL環境
- 組込みシステム向けメニーコア用OpenCL環境
- メニーコアプロセッサを対象とした柔軟性を有するハードウェアバリア機構の提案
- C-001 TCP/IPハードコアの設計とその消費電力解析(C.アーキテクチャ・ハードウェア)
- キャッシュウェイ割り当てとコード配置の同時最適化によるメモリアクセスエネルギーの削減(プロセッサ,DSP,画像処理技術及び一般)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- キャッシュウェイ割り当てとコード配置の同時最適化によるメモリアクセスエネルギーの削減(プロセッサ,DSP,画像処理技術及び一般)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- キャッシュウェイ割り当てとコード配置の同時最適化によるメモリアクセスエネルギーの削減(プロセッサ,DSP,画像処理技術及び一般)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- データ圧縮による画像処理用メモリの低消費電力化手法とその評価
- データ圧縮による画像処理用メモリの低消費電力化手法とその評価
- トランザクショナルメモリにおける並列実行トランザクション数動的制御法の提案とその評価(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- FPGAを用いたメニーコア・アーキテクチャSMYLErefの評価環境の構築(評価,集積回路とアーキテクチャの協創〜ノーマリオフコンピューティングによる低消費電力化への挑戦〜)
- FPGAを用いたメニーコア・アーキテクチャ SMYLEref の評価環境の構築
- 組込みシステム向けメニーコア用OpenCL環境(設計環境,組込み技術とネットワークに関するワークショップETNET2012)
- 組込みシステム向けメニーコア用OpenCL環境(設計環境,組込み技術とネットワークに関するワークショップETNET2012)
- AI-1-1 メニーコアプロセッサはメインストリームになり得るか?(AI-1.メニーコアプロセッサはメインストリームになり得るか?,依頼シンポジウム,ソサイエティ企画)
- 低消費電力メディア・アプリケーション向けヒストリ・ベース・タグ比較キャッシュの評価
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 世界の基本技術となったway selection cache(招待講演,デザインガイア2012-VLSI設計の新しい大地-)
- SMYEOpenCLの実装と128コア上での評価実験(並列処理,集積回路とアーキテクチャの協創〜新しいアプリケーション創造に向けたアーキテクチャ、回路技術の貢献〜)
- ライン単位における値の局所性によりキャッシュ容量を有効利用するライン共有キャッシュ(記念講演,VLD Excellent Student Award講演,システムオンシリコンを支える設計技術)