High Bandwidth, Variable Line-Size Cache Architecture for Merged DRAM/Logic LSIs(Special Issue on Novel VLSI Processor Architectures)
スポンサーリンク
概要
- 論文の詳細を見る
Merged DRAM/logic LSIs could provide high on-chip memory bandwidth by interconnecting logic portions and DRAM with wider on-chip buses.For merged DRAM/logic LSIs with the memory hierachy including cache memory, we can exploit such high on-chip memory bandwidth by means of replacing a whole cache line(or cache block)at a time on cache misses.This approach tends to increase the cache-line size if we attempt to improve the attainable memory bandwidth.Larger cache line, however, might worsen the system performance if programs running on the LSIs do not have enough spatial locality of reference and cache misses frequency take place.This paper describes a novel cache architecture suitable for merged DRAM/logic LSIs, called variable line-size cache or VLS cache, for resolving the above-mentioned dilemma.The VLS cache can make good use of the high on-chip memory bandwidth by means of larger cache lines and, at the same time, alleviate the negative effects of larger cache-line size by partitioning each large cache line into multiple sub-lines and allowing every sub-line to work as an independent cache line.The number of sub-lines involved when a cache replacement occurs can be determined depending on the characteristics of programs.This paper also evaluates the cost/performance improvements attainable by the VLS cache and compares it with those of conventional cache architectures.As a result, it is observed that a VLS cache reduces the average memory-access time by 16.4% while it increases the hardware cost by only 13%, compared to a conventional direct-mapped cache with fixed 32-byte lines.
- 社団法人電子情報通信学会の論文
- 1998-09-25
著者
-
Inoue K
Kwansei Gakuin Univ. Sanda Jpn
-
Murakami Kazuaki
The Authors Are With The Department Of Computer Science And Communication Engineering Kyushu Univers
-
Inoue K.
Univ. Tokyo Tokyo Jpn
-
Inoue K
Semiconductor Group System-lsi Div. Mitsubishi Electric Co.
-
Murakami K
Department Of Informatics Kyushu University
-
Inoue K
Univ. Tokyo Tokyo Jpn
-
Ito Kosei
Graduate School Of Agricultural Science Tohoku University
-
KAI Koji
The author is with the Institute of Systems & Information Technologies
-
Kai Koji
Institute Of Systems & Information Technologies
-
INOUE Koji
The authors are with the Department of Computer Science and Communication Engineerintg, Kyushu Unive
関連論文
- 演算/メモリ性能バランスを考慮したCMP向けオンチップ・メモリ貸与法の提案(マイクロプロセッサ)
- 科学技術計算を対象とした大規模再構成可能データパスの性能評価(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 部分一括描画装置の処理能力向上のための描画面積最適化(計算機システム化技術,システムLSI設計とその技術)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(オンチップ・ネットワーク,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 動的再構成可能プロセッサVulcan2とそのソフトウェア開発環境ISAccに関する研究(リコンフィギャラブルプロセッサ,リコンフィギャラブルシステム,一般)
- Redefis:動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサVulcan2,および,その開発ツールISAcc(プロセッサ)
- 動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサ Vulcan2, および, その開発ツールISAcc
- C-12-29 演算/メモリ性能のバランスを考慮したマルチコア実行方式(C-12.集積回路,一般セッション)
- C-12-32 演算器配列型アクセラレータの温度解析(C-12.集積回路,一般セッション)
- C-8-7 単一磁束量子回路を用いた2並列3段の再構成可能なデータパスの検討(C-8.超伝導エレクトロニクス,一般セッション)
- C-8-10 2並列4段の再構成可能なデータパスを有する単一磁束量子回路の検討(C-8.超伝導エレクトロニクス,一般セッション)
- C-8-21 単一磁束量子回路における2並列2段の再構成可能なデータパスの動作実証(C-8. 超伝導エレクトロニクス,一般セッション)
- C-8-16 アドバンストプロセス2.1を用いた2並列2段のSFQ-RDPの検討(C-8.超伝導エレクトロニクス,一般セッション)
- SRAM/DRAMハイブリッド・キャッシュにおける実行時動作モード決定法の提案
- D-1-5 掌紋による生体認証の計算時間と精度の関係(D-1.コンピュテーション,一般セッション)
- 近似文字列照合プログラム実行の特徴解析と高速化に関する検討(解析・省電力,SWoPP2006)
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- Redefis:動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサVulcan2,および,その開発ツールISAcc(プロセッサ)
- マルチコア向けオンチップメモリ貸与法における実行コード生成法の改善
- マルチコア向けオンチップメモリ貸与法における実行コード生成法の改善
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- C-12-31 命令フェッチ機構の共有に基づく低消費エネルギー化手法の提案(C-12.集積回路,一般セッション)
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 適応的ヘルパースレッド実行に基づくマルチコア向け演算/メモリ性能バランシング
- 3次元DRAM-プロセッサ積層実装を対象としたオンチップ・メモリ・アーキテクチャの提案と評価
- 適応的ヘルパースレッド実行に基づくマルチコア向け演算/メモリ性能バランシング
- 3次元DRAM-プロセッサ積層実装を対象としたオンチップ・メモリ・アーキテクチャの提案と評価
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- プラットフォーム化の功績と今後の課題(組込みシステムプラットフォーム)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- 大規模並列システムの性能評価を目的としたプログラムコード抽象化技法(HPC-3 : スケジューリング)
- 負荷バランスの動的最適化によるMPIブロードキャスト性能改善
- 演算/メモリ性能バランスを考慮したCMP向けオンチップ・メモリ貸与法の提案(マイクロプロセッサ)
- Cellプロセッサへの分子軌道法プログラムの実装と評価(HPC-6 : 並列アプリケーション)
- 210 Ni_2MnGa 強磁性形状記憶合金の変形挙動
- 102 Ni_2MnGa(Fe) 強磁性形状記憶合金の機械的性質におよぼす温度の影響
- チップマルチプロセッサにおけるデータ・プリフェッチ効果の分析(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- チップマルチプロセッサにおけるデータ・プリフェッチ効果の分析(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- シミュレーション結果の再利用に基づくキャッシュ・ミス率予測法の提案(組込みシステムプラットフォーム)
- Quantitative Evaluation of State-Preserving Leakage Reduction Algorithm for L1 Data Caches
- 性能モデルによる予測を併用したAlltoallアルゴリズム動的選択技術の評価(性能予測)
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信タイミングを考慮した衝突削減のためのMPIランク配置最適化技術(並列計算)
- 負荷ばらつきを考慮したMPIブロードキャスト通信の動的最適化に関する研究(HPC-11 : 通信I)
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- Predation pressure on the siphons of the bivalve Nuttallia olivacea by the juvenile stone flounder Platichthys bicoloratus in the Natori River estuary, north-eastern Japan
- Structures of the Siphons of the Bivalve Nuttallia olivacea (Tellinacea, Psammobiidae) and Changes of their States under Extended Conditions
- Two Dimensional Semiconductor-Based Photonic Crystal Slab Waveguides for Ultra-Fast Optical Signal Processing Devices(Photonic Crystals and Their Device Applications)
- プラットフォーム化の功績と今後の課題(組込みシステムプラットフォーム)
- プラットフォーム化の功績と今後の課題(組み込みシステムプラットフォーム)
- Effect of Steroid Hormone Administration on the Breakdown of Muscle Proteins in Ayu
- Effect of Maturation on the Contents of Free and Bound Forms of Hydroxyproline in Ayu Muscle
- A transgene and its expression profile are stably transmitted to offspring in transgenic medaka generated by the particle gun method
- Transgenic Medaka Overexpressing a Melanin-Concentrating Hormone Exhibit Lightened Body Color but No Remarkable Abnormality
- Transgenic Fish : Biological and Technical Problems
- Optical Label Switching Using Optical Label Based on Wavelength and Pilot Tone Frequency (Joint Special Issue on Recent Progress in Optoelectronics and Communications)
- Optical Label Switching Using Optical Label Based on Wavelength and Pilot Tone Frequency (Joint Special Issue on Recent Progress in Optoelectronics and Communications)
- Wavelength-Dependent Coupling Characteristics in Two-Dimensional Photonic-Crystal Slab Directional Coupler
- Comparing Reading Techniques for Object-Oriented Design Inspection(Software Engineering)
- Extended Metrics to Evaluate Cost Effectiveness of Software Inspections(Software Engineering)
- Technology Mapping Technique for Increasing Throughput of Character Projection Lithography(Lithography-Related Techniques,Fundamentals and Applications of Advanced Semiconductor Devices)
- Cell Library Development Methodology for Throughput Enhancement of Character Projection Equipment (CAD, VLSI Design Technology in the Sub-100nm Era)
- Character Projection Mask Set Optimization for Enhancing Throughput of MCC Projection Systems
- Test Architecture Optimization for System-on-a-Chip under Floorplanning Constraints(Test)(VLSI Design and CAD Algorithms)
- データ値の局所性を利用したライン共有キャッシュの提案
- 稼働コア数制限に基づくマルチコア・プロセッサ性能向上手法の提案
- 温度を考慮した3次元積層LSI向け低消費エネルギーL2キャッシュの提案
- Evaluating DRAM Refresh Architectures for Merged DRAM/Logic LSIs(Special Issue on Novel VLSI Processor Architectures)
- Analyzing and Reducing the Impact of Shorter Data Retention Time on the Performance of Merged DRAM/Logic LSIs(Special Issue on Novel VLSI Processor Architectures)
- Instruction Encoding for Reducing Power Consumption of I-ROMs Based on Execution Locality
- Trends in High-Performance, Low-Power Cache Memory Architectures
- Omitting Cache Look-up for High-Performance, Low-Power Microprocessors(Special Issue on High-Performance and Low-Power Microprocessors)
- A High-Performance/Low-Power On-Chip Memory-Path Architecture with Variable Cache-Line Size
- Dynamically Variable Line-Size Cache Architecture for Merged DRAM/Logic LSIs
- High Bandwidth, Variable Line-Size Cache Architecture for Merged DRAM/Logic LSIs(Special Issue on Novel VLSI Processor Architectures)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討
- A WSiN-Gate GaAs HMESFET with an Asymmetric LDD Structure for MMICs
- シミュレーション結果の再利用によるキャッシュ・ミス率予測技術
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- 画像認識向け3次元積層アクセラレータ・アーキテクチャの検討(プロセッサ,DSP,画像処理技術及び一般)
- A-12 Niフリーの新Ti基形状記憶・超弾性合金
- PTaaS(Platform for Tool as a Service) : クラウドサービスを通じて開発ツールを提供する(設計手法及び一般,デザインガイア2011-VLSI設計の新しい大地-)
- システムLSIの消費エネルギー見積もりの高精度化に関する検討(アーキテクチャと評価,デザインガイア2011-VLSI設計の新しい大地-)
- システムLSIの消費エネルギー見積もりの高精度化に関する検討(アーキテクチャと評価,デザインガイア2011-VLSI設計の新しい大地-)
- SystemCトランザクションレベルモデルのシミュレーション高速化手法の検討(異種デバイス集積化/高密度実装技術,デザインガイア2011-VLSI設計の新しい大地-)
- SystemCトランザクションレベルモデルのシミュレーション高速化手法の検討(異種デバイス集積化/高密度実装技術,デザインガイア2011-VLSI設計の新しい大地-)
- 参照密度関数に基づく参照局所性の形式化の試行(理論とアルゴリズム,デザインガイア2011-VLSI設計の新しい大地-)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- マルチスケールフィルタ向けアクセラレータ・アーキテクチャの提案(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)