A High-Performance/Low-Power On-Chip Memory-Path Architecture with Variable Cache-Line Size
スポンサーリンク
概要
- 論文の詳細を見る
This paper proposes an on-chip memory-path architecture employing the dynamically variable line-size (D-VLS) cache for high performance and low energy consumption. The D-VLS cache exploits the high on-chip memory bandwidth attainable on merged DRAM/logic LSIs by replacing a whole large cache line in one cycle. At the same time, it attempts to avoid frequent evictions by decreasing the cache-line size when programs have poor spatial locality. Activating only on-chip DRAM subarrays corresponding to a replaced cache-line size produces a significant energy reduction. In our simulation, it is observed that our proposed on-chip memory-path architecture, which employs a direct-mapped D-VLS cache, improves the ED (Energy Delay) product by more than 75% over a conventional memory-path model.
- 社団法人電子情報通信学会の論文
- 2000-11-25
著者
-
Inoue K
Kwansei Gakuin Univ. Sanda Jpn
-
Murakami Kazuaki
The Department Of Computer Science And Communication Engineering Kyushu University
-
Murakami Kazuaki
The Authors Are With The Department Of Computer Science And Communication Engineering Kyushu Univers
-
Inoue K.
Univ. Tokyo Tokyo Jpn
-
Inoue K
Semiconductor Group System-lsi Div. Mitsubishi Electric Co.
-
Murakami K
Department Of Informatics Kyushu University
-
INOUE Koji
the Department of Internal Medicine and Department of Pathology, Nationasl Kinki-Chuo Hospiatl for C
-
Inoue K
Univ. Tokyo Tokyo Jpn
-
Ito Kosei
Graduate School Of Agricultural Science Tohoku University
-
Kai Koji
Institute Of Systems & Information Technologies
-
Inoue Koji
The Department Of Computer Science And Communication Engineering Kyushu University
関連論文
- 演算/メモリ性能バランスを考慮したCMP向けオンチップ・メモリ貸与法の提案(マイクロプロセッサ)
- 科学技術計算を対象とした大規模再構成可能データパスの性能評価(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 部分一括描画装置の処理能力向上のための描画面積最適化(計算機システム化技術,システムLSI設計とその技術)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(オンチップ・ネットワーク,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 動的再構成可能プロセッサVulcan2とそのソフトウェア開発環境ISAccに関する研究(リコンフィギャラブルプロセッサ,リコンフィギャラブルシステム,一般)
- Redefis:動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサVulcan2,および,その開発ツールISAcc(プロセッサ)
- 動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサ Vulcan2, および, その開発ツールISAcc
- C-12-29 演算/メモリ性能のバランスを考慮したマルチコア実行方式(C-12.集積回路,一般セッション)
- C-12-32 演算器配列型アクセラレータの温度解析(C-12.集積回路,一般セッション)
- C-8-7 単一磁束量子回路を用いた2並列3段の再構成可能なデータパスの検討(C-8.超伝導エレクトロニクス,一般セッション)
- C-8-10 2並列4段の再構成可能なデータパスを有する単一磁束量子回路の検討(C-8.超伝導エレクトロニクス,一般セッション)
- C-8-21 単一磁束量子回路における2並列2段の再構成可能なデータパスの動作実証(C-8. 超伝導エレクトロニクス,一般セッション)
- C-8-16 アドバンストプロセス2.1を用いた2並列2段のSFQ-RDPの検討(C-8.超伝導エレクトロニクス,一般セッション)
- SRAM/DRAMハイブリッド・キャッシュにおける実行時動作モード決定法の提案
- D-1-5 掌紋による生体認証の計算時間と精度の関係(D-1.コンピュテーション,一般セッション)
- 近似文字列照合プログラム実行の特徴解析と高速化に関する検討(解析・省電力,SWoPP2006)
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- Redefis:動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサVulcan2,および,その開発ツールISAcc(プロセッサ)
- マルチコア向けオンチップメモリ貸与法における実行コード生成法の改善
- マルチコア向けオンチップメモリ貸与法における実行コード生成法の改善
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- C-12-31 命令フェッチ機構の共有に基づく低消費エネルギー化手法の提案(C-12.集積回路,一般セッション)
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 適応的ヘルパースレッド実行に基づくマルチコア向け演算/メモリ性能バランシング
- 3次元DRAM-プロセッサ積層実装を対象としたオンチップ・メモリ・アーキテクチャの提案と評価
- 適応的ヘルパースレッド実行に基づくマルチコア向け演算/メモリ性能バランシング
- 3次元DRAM-プロセッサ積層実装を対象としたオンチップ・メモリ・アーキテクチャの提案と評価
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- プラットフォーム化の功績と今後の課題(組込みシステムプラットフォーム)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- 大規模並列システムの性能評価を目的としたプログラムコード抽象化技法(HPC-3 : スケジューリング)
- 負荷バランスの動的最適化によるMPIブロードキャスト性能改善
- 演算/メモリ性能バランスを考慮したCMP向けオンチップ・メモリ貸与法の提案(マイクロプロセッサ)
- Cellプロセッサへの分子軌道法プログラムの実装と評価(HPC-6 : 並列アプリケーション)
- 210 Ni_2MnGa 強磁性形状記憶合金の変形挙動
- 102 Ni_2MnGa(Fe) 強磁性形状記憶合金の機械的性質におよぼす温度の影響
- チップマルチプロセッサにおけるデータ・プリフェッチ効果の分析(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- チップマルチプロセッサにおけるデータ・プリフェッチ効果の分析(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- Quantitative Evaluation of State-Preserving Leakage Reduction Algorithm for L1 Data Caches
- 性能モデルによる予測を併用したAlltoallアルゴリズム動的選択技術の評価(性能予測)
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信タイミングを考慮した衝突削減のためのMPIランク配置最適化技術(並列計算)
- 負荷ばらつきを考慮したMPIブロードキャスト通信の動的最適化に関する研究(HPC-11 : 通信I)
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- Predation pressure on the siphons of the bivalve Nuttallia olivacea by the juvenile stone flounder Platichthys bicoloratus in the Natori River estuary, north-eastern Japan
- Structures of the Siphons of the Bivalve Nuttallia olivacea (Tellinacea, Psammobiidae) and Changes of their States under Extended Conditions
- Two Dimensional Semiconductor-Based Photonic Crystal Slab Waveguides for Ultra-Fast Optical Signal Processing Devices(Photonic Crystals and Their Device Applications)
- Effect of Steroid Hormone Administration on the Breakdown of Muscle Proteins in Ayu
- Effect of Maturation on the Contents of Free and Bound Forms of Hydroxyproline in Ayu Muscle
- A transgene and its expression profile are stably transmitted to offspring in transgenic medaka generated by the particle gun method
- Transgenic Medaka Overexpressing a Melanin-Concentrating Hormone Exhibit Lightened Body Color but No Remarkable Abnormality
- Transgenic Fish : Biological and Technical Problems
- Optical Label Switching Using Optical Label Based on Wavelength and Pilot Tone Frequency (Joint Special Issue on Recent Progress in Optoelectronics and Communications)
- Optical Label Switching Using Optical Label Based on Wavelength and Pilot Tone Frequency (Joint Special Issue on Recent Progress in Optoelectronics and Communications)
- Wavelength-Dependent Coupling Characteristics in Two-Dimensional Photonic-Crystal Slab Directional Coupler
- Comparing Reading Techniques for Object-Oriented Design Inspection(Software Engineering)
- Extended Metrics to Evaluate Cost Effectiveness of Software Inspections(Software Engineering)
- Technology Mapping Technique for Increasing Throughput of Character Projection Lithography(Lithography-Related Techniques,Fundamentals and Applications of Advanced Semiconductor Devices)
- Cell Library Development Methodology for Throughput Enhancement of Character Projection Equipment (CAD, VLSI Design Technology in the Sub-100nm Era)
- Character Projection Mask Set Optimization for Enhancing Throughput of MCC Projection Systems
- Test Architecture Optimization for System-on-a-Chip under Floorplanning Constraints(Test)(VLSI Design and CAD Algorithms)
- Trends in High-Performance, Low-Power Processor Architectures (Special Issue on Low-Power High-Performance VLSI Processors and Technologies)
- データ値の局所性を利用したライン共有キャッシュの提案
- 稼働コア数制限に基づくマルチコア・プロセッサ性能向上手法の提案
- 温度を考慮した3次元積層LSI向け低消費エネルギーL2キャッシュの提案
- Evaluating DRAM Refresh Architectures for Merged DRAM/Logic LSIs(Special Issue on Novel VLSI Processor Architectures)
- Analyzing and Reducing the Impact of Shorter Data Retention Time on the Performance of Merged DRAM/Logic LSIs(Special Issue on Novel VLSI Processor Architectures)
- A High-Performance and Low-Power Cache Architecture with Speculative Way-Selection (Special Issue on Low-Power High-Speed CMOS LSI Technologies)
- Instruction Encoding for Reducing Power Consumption of I-ROMs Based on Execution Locality
- Trends in High-Performance, Low-Power Cache Memory Architectures
- Omitting Cache Look-up for High-Performance, Low-Power Microprocessors(Special Issue on High-Performance and Low-Power Microprocessors)
- A High-Performance/Low-Power On-Chip Memory-Path Architecture with Variable Cache-Line Size
- Dynamically Variable Line-Size Cache Architecture for Merged DRAM/Logic LSIs
- High Bandwidth, Variable Line-Size Cache Architecture for Merged DRAM/Logic LSIs(Special Issue on Novel VLSI Processor Architectures)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討
- A WSiN-Gate GaAs HMESFET with an Asymmetric LDD Structure for MMICs
- シミュレーション結果の再利用によるキャッシュ・ミス率予測技術
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- A-12 Niフリーの新Ti基形状記憶・超弾性合金
- PTaaS(Platform for Tool as a Service) : クラウドサービスを通じて開発ツールを提供する(設計手法及び一般,デザインガイア2011-VLSI設計の新しい大地-)
- システムLSIの消費エネルギー見積もりの高精度化に関する検討(アーキテクチャと評価,デザインガイア2011-VLSI設計の新しい大地-)
- システムLSIの消費エネルギー見積もりの高精度化に関する検討(アーキテクチャと評価,デザインガイア2011-VLSI設計の新しい大地-)
- SystemCトランザクションレベルモデルのシミュレーション高速化手法の検討(異種デバイス集積化/高密度実装技術,デザインガイア2011-VLSI設計の新しい大地-)
- SystemCトランザクションレベルモデルのシミュレーション高速化手法の検討(異種デバイス集積化/高密度実装技術,デザインガイア2011-VLSI設計の新しい大地-)
- 参照密度関数に基づく参照局所性の形式化の試行(理論とアルゴリズム,デザインガイア2011-VLSI設計の新しい大地-)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)