マルチスレッド処理におけるキャッシュ構成方式の検討
スポンサーリンク
概要
- 論文の詳細を見る
近年、プロセッサの処理速度と主記憶アクセスレーテンシのギャップがプロセッサの実効性能に与える影響は、極めて大きくなっている。このためにキャッシュメモリが用いられ、プログラムの制御フローが予測可能な場合には、プリフェッチなどの手段でメモリアクセスレーテンシを隠蔽することが可能である。しかし、一般にプログラム制御フローが予測不能な場合には、キャッシュミス時のメモリアクセスレーテンシは隠蔽できない。そこで、マルチスレッド処理[1]によりレーテンシの隠蔽を行なう手法が考えられるが、逆にキャッシュミスが増大して、十分な性能が発揮できない恐れもある。本稿では単一プロセッサ上での、単位時間当りの処理件数を問題とするようなマルチスレッド処理を対象とし、victim cache[2]を含む種々のキャッシュ構成方式の有効性を、シミュレーションにより検討する。
- 一般社団法人情報処理学会の論文
- 1995-09-20
著者
-
朴 泰祐
筑波大学 電子・情報工学系
-
中澤 喜三郎
明星大学情報学部電子情報学科
-
中村 宏
筑波大学 電子・情報工学系
-
中澤 喜三郎
筑波大学 電子・情報工学系
-
浦田 卓治
筑波大学 電子・情報工学系
-
朴 泰祐
筑波大学 計算科学研究センター
関連論文
- クラスタをメモリ資源として利用するためのMPIに基づいた高速大容量仮想メモリ(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- Heterogeneous Multi-Computer System : 連続体・多粒子系融合型超並列計算機システム
- 演算加速機構を持つオンチップメモリプロセッサの電力性能評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 高性能・耐故障マルチリンクEthernet結合システムのNFSへの適用と評価(クラスタとグリッド技術)
- ユーザ透過に利用可能な耐故障・高性能マルチリンクEthernet結合システム(クラスタと省電力技術)
- T2K筑波システムにおけるLinpack性能評価(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ:PEACH (集積回路)
- マルチパスネットワークを持つPCクラスタにおける動的経路制御システム(クラスタシステム)
- ディペンダブルな組込みシステムに適した省電力高性能通信機構(通信とグリッドII)
- tagged-VLANを用いたPCクラスタ向けマルチパスネットワークにおける動的ルーティング(HPC-13 : 通信II)
- EthernetマルチリンクによるPCクラスタ向け高バンド幅・耐故障ネットワークRI2N/UDP(ネットワーク)
- tagged-VLANとマルチリンクに基づくPCクラスタ向け高性能・耐故障ネットワークの実装と評価(Session 3:Cluster/Grid)
- VFREC-Net : ドライバ制御によるtagged-VLANを用いたPCクラスタ向けマルチパスネットワーク(ネットワーク)
- UDPによるファイアウォール越えを用いたP2Pオーバーレイネットワーク(HPC-7 : 分散環境(1))
- 超並列計算機CP-PACSにおける分子動力学法シミュレーション
- 超並列計算機CP-PACSにおけるPVMの実装
- CP-PACSパイロットモデルにおけるLINPACKベンチマークの高速化
- CP-PACSパイロットモデルにおけるNAS並列ベンチマークの評価
- OpenMPを用いた並列ベンチマークプログラムによる組込み向けマルチコアプロセッサの評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- プリフェッチ機構を持つマルチコア向けソフトウェア分散共有メモリシステム(HPC-14:分散処理,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 超並列計算機用多段結合網における転送性能の解析 (並列処理)
- ハイパクロスバ・ネットワークにおける転送性能向上のための手法とその評価
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- PCクラスタにおける電力実行プロファイル情報を用いたDVS制御による電力性能の最適化(クラスタシステム)
- 超低電力メガスケールシステムのプロトタイプ : MegaProto
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチレール相互結合網における通信プロファイリングに基づく性能最適化
- トラフィック量に適応する非対称マルチリンクEthernetトランキング
- 分散メモリ向け並列言語XcalableMPコンパイラの実装と性能評価
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- XcalableMPによるNAS Parallel Benchmarksの実装と評価
- 行列積を用いた古典Gram-Schmidt直交化法の並列化
- 計算素粒子物理学分野の国際データグリッドILDGと国内グリッドJLDG(グリッドI)
- PACS-CSにおける隣接通信性能の高速化(HPC-13 : 通信II)
- PACS-CSのための高性能通信ライブラリインターフェイスの設計(HPC-12 : 大規模運用システム(2))
- 行列積を用いた古典Gram-Schmidt直交化の並列化手法の検討(数値計算2)
- 演算加速機構を持つオンチップメモリプロセッサの検討と電力性能評価
- DVFS制御を目的としたプログラムの領域分割(Session 6:低消費電力)
- MegaProto/Eにおける電力性能評価および電力性能最適化の検討(Session 6:低消費電力)
- DVS制御による負荷不均衡のある並列プログラムの電力量削減手法(クラスタシステム)
- PCクラスタにおける全体電力プロファイルを用いた電力性能最適化(ARC-1:低電力アーキテクチャ,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 科学技術計算用超並列クラスタPACS-CSの実装と基本性能評価(HPC-12 : 大規模運用システム(2))
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- クラスタをメモリ資源として利用するためのMPIによる高速大容量メモリ
- 分散メモリ向け並列言語XcalableMPにおけるユーザ定義データ分散機能の検討
- 非対称な形状に適応する高バンド幅multi-link Ethernet
- 組込み機器向けon-chip/off-chipコア間通信機構
- XcalableMPによるNAS Parallel Benchmarks の実装と評価
- 分散メモリ向け並列言語XcalableMPコンパイラの試作と評価
- 高性能・耐故障マルチリンクEthernet結合システムの性能評価
- ユーザ透過に利用可能な高性能・耐故障マルチリンクEthernet結合システム
- VHDLによるハイパクロスバ網用ルータ・チップの設計
- 複数グリッドジョブ実行システムの計算資源を統合・利用するGrid RPCシステムの設計と実装(グリッドシステム)
- 分散メモリ向け並列言語 XcalableMP におけるユーザ定義データ分散機能の検討
- PCI Express による省電力・高信頼・高性能通信リンクのためのコミュニケータチップ : PEACH
- 超並列ネットワーク MDX用ルータチップの自動設計システム
- MDX-Baseline : 交信局所性とランダム交信能力を共に満足する網
- 並列処理ネットワークのための性能評価用シミュレータ生成系INSPIRE
- 超並列計算機CP-PACSにおけるNPB Kernel CGの評価(並列処理)
- 超並列計算機CP-PACSのネットワーク性能評価
- 超並列計算機CP-PACSの基本性能評価
- 方式レベル記述言語AIDLを用いた高性能プロセッサ設計支援
- 擬似ベクトルプロセッサにおける高速リストベクトル処理
- 超並列計算機CP-PACSのCGベンチマークによる性能評価
- 並列計算機の仮想性能評価システムVIPPES
- ハイパクロスバ・ネットワークにおけるVirtual Channelの動的選択による適応ルーティング
- 計算物理学研究用並列計算機 : CP-PACS
- 2. 超並列計算機 CP-PACS のアーキテクチャ ( 計算物理学と超並列計算機 : CP-PACS計画)
- リストベクトル処理における擬似ベクトルプロセッサPVP-SWの評価
- マルチスレッド処理におけるキャッシュ構成方式の検討
- 21世紀に向けた計算機アーキテクチャ
- 組込み機器向け on-chip/off-chip コア間通信機構の実装と評価
- 組込み機器向け on-chip/off-chip コア間通信機構の実装と評価
- 組込み機器向け on-chip/off-chip コア間通信機構の実装と評価
- メモリバンド幅に着目したマルチコアノード上のアプリケーション最適化
- 組込み機器向け on-chip/off-chip コア間通信機構
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- 分散メモリ向けデータ並列言語OpenMPDの設計と実装(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 分散メモリ向けデータ並列言語OpenMPDの設計と実装(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 複数Gigabit Ethernetを用いたPACS-CSのための高性能通信機構の設計と評価(ネットワーク)
- スライドウインドウを用いた擬似ベクトル処理
- PGAS言語XcalableMPのmulti-node GPU向け拡張仕様の実装と評価
- 演算加速装置に基づく超並列クラスタHA-PACSによる大規模計算科学
- スクリプト言語Xcryptによる格子QCDシミュレーションの最適化
- 並列言語XcalableMPのGPU向け拡張
- PGAS言語XcalableMPとUnified Parallel Cの性能比較
- PCI Expressを用いた通信リンクPEARLにおけるネットワーク管理機構
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- OmniRPC : グリッド環境での並列プログラミングのためのGrid RPCシステム(高性能計算及び一般)
- ハイパフォーマンスコンピューティングに適したメモリアーキテクチャの予備評価
- 気象モデルの高解像度計算のGPU化
- コモディティネットワークに基づく並列入出力システム
- 並列言語XcalableMPのアクセラレータ向け言語拡張のOpenCL実装
- ハイパ・クロスバ・ネットワークを用いた並列計算機におけるアレイの高速転置アルゴリズム