メニーコア時代に向けたインオーダ・アーキテクチャ再考(システムアーキテクチャ2,デザインガイア2010-VLSI設計の新しい大地-)
スポンサーリンク
概要
- 論文の詳細を見る
面積や熱効率の観点から,インオーダ・アーキテクチャが,次世代メニーコアプロセッサのコアとして注目を集めている.しかし,ILPを活用するアウトオブオーダ・アーキテクチャと比較して,インオーダ・アーキテクチャの方がメニーコアプロセッサのコアとして面積や電力性能比において有用であるか,十分に議論されていない.そこで,本論文では,1チップ内に100コア〜1000コア程度を搭載するメニーコアプロセッサのコアとしてアウトオブオーダ・アーキテクチャとインオーダ・アーキテクチャの計算性能を比較する.サイクルレベルのシミュレータを用い,アウトオブオーダ・アーキテクチャとインオーダ・アーキテクチャで,(1)各コアが一般的なサイズのキャッシュメモリを有するアーキテクチャ,(2)極少量のL1キャッシュと比較的大き目のL2キャッシュをもつアーキテクチャ,(3)少量のL1キャッシュ,L2キャッシュを有するアーキテクチャをケーススタデイとして各コアのIPCを評価する.また,それぞれの構成における,面積当たりの計算性能を概算する.
- 2010-11-23
著者
-
三好 健文
東京工業大学大学院情報理工学研究科
-
吉永 努
電気通信大学情報システム学研究科
-
吉永 努
電気通信大学大学院情報システム学研究科
-
吉永 務
宇都宮大学工学部
-
三好 健文
電気通信大学大学院情報システム学研究科|独立行政法人科学技術振興機構
-
入江 英嗣
電気通信大学大学院情報システム学研究科
-
三好 健文
東京工業大学大学院情報理工学研究科|独立行政法人科学技術振興機構
-
松村 雄貴
電気通信大学大学院情報システム学研究科情報ネットワークシステム学専攻
-
松村 雄貴
電気通信大学大学院情報システム学研究科
-
吉永 努
電気通信大学
-
入江 英嗣
電気通信大学
-
三好 健文
電気通信大学大学院情報システム学研究科
関連論文
- スケーラブルFPGAシステムにおけるハードウェア拡張方式 (リコンフィギャラブルシステム)
- メニーコアプロセッサのためのネットワークトラフィックに着目したタスク配置問題の解析と考察(ネットワーク,クラウド及び一般)
- 小容量FPGAによるスケーラブルなシステム評価環境の構築手法(応用2)
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 低遅延オンチップネットワークのための予測ルータの評価(組込みシステムプラットフォーム)
- 6ZD-4 マルチリンクEthernet環境におけるSMPクラスタの性能評価(ネットワークと専用アーキテクチャ,学生セッション,アーキテクチャ)
- 動的故障に対応する並列計算機用適応ルータに関する検討(ディペンダブルコンピュータシステム及び一般)
- ヘテロジニアスマルチプロセッサのためのタスク分散手法(ARC-2:マルチコア1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 予測機構を持った低遅延オンチップルータアーキテクチャ(オンチップ・ネットワーク/メモリシステム,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 耐故障・適応デッドロック回復ルーチングのためのネットワーク再構成プロトコル(コンピュータシステム)
- コンパイラとランタイムによるソフトウェアキャッシュの更新オーバヘッド隠蔽手法
- CoreSymphonyアーキテクチャのための物理レジスタ管理手法
- Ruby用仮想マシンにおけるAOTコンパイラ
- SmartCoreシステムによるメニーコアプロセッサの信頼性向上手法
- SmartCoreシステムによるメニーコアプロセッサの信頼性向上手法
- 並列計算機ノードのシステムオンチップ化とその性能
- 3H-3 システムオンチップ化ノードで構成する並列計算機の初期的検討
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- 2M-5 マルチコアシステムにおけるルータの実装と評価(ネットワークアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 低遅延オンチップネットワークのための予測ルータの評価
- Feature-Packingのためのソフトウェアによるメモリ管理手法の実装と評価
- Feature-Packingのためのソフトウェアによるメモリ管理手法の実装と評価
- メニーコアアーキテクチャ研究のためのスケーラブルなHW評価環境ScalableCoreシステム
- メニーコア向けタスクスケジューリングシステムの検討
- CoreSymphonyアーキテクチャの高効率化
- 低遅延オンチップネットワークのための予測ルータの評価(組込みシステムプラットフォーム)
- 低遅延オンチップネットワークのための予測ルータの評価(組込みシステムプラットフォーム)
- 予測機構を持つルータを用いた低遅延チップ内ネットワークに関する研究
- 予測ルータによる低遅延Fat Treeネットワーク
- キュー計算原理によるSMT型マルチスレッド並列キュープロセッサの提案と設計(アーキテクチャ)
- キュー計算原理によるSMT型マルチスレッド並列キュープロセッサの提案と設計
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- A-3-3 バス接続バイパス構造を用いたマルチプロセッサのためのコードスケジューリング最適化手法についての検討(A-3.VLSI設計技術,一般講演)
- A-3-2 バイパス構造をバス接続したマルチプロセッサによる消費電力削減の検討(A-3.VLSI設計技術,一般講演)
- 3M-4 メニーコアプロセッサにおける効率的なキャッシュシステム(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- C-026 携帯端末とネットワーク上計算資源の協調によるカメラセンサアプリ高速化の検討(C分野:ハードウェア・アーキテクチャ,一般論文)
- PCクラスタによる行動支援サービスプラットフォームZeoBroの初期実装と評価(ホームネットワーク,ユビキタスネットワーク,クラウドコンピューティング,コンテキストアウェア,位置情報サービス,eコマース及び一般)
- メニーコア時代に向けたインオーダ・アーキテクチャ再考(システムアーキテクチャ2,デザインガイア2010-VLSI設計の新しい大地-)
- 2ZP-5 未知のSQLインジェクション攻撃検知システムの構築(情報爆発時代における分散処理と運用技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 4M-7 メニーコアプロセッサ向けプロトタイピングシステムの高速化(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4M-6 メニーコアプロセッサにおける柔軟なタスク配置を実現する論理コア変換機構(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4M-3 メニーコアプロセッサの性能向上を目指すタスク配置手法(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4M-2 洗練されたメニーコアアーキテクチャの開発(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-6 CMPの逐次性能向上を目指すCoreSymphonyアーキテクチャ(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-3 コア融合アーキテクチャのためのプログラムの振舞いに着目した融合コア数の制御(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- CoreSymphony アーキテクチャのための物理レジスタ管理手法
- CoreSymphony アーキテクチャの高効率化
- 2-Dトーラスネットワークにおける動的通信予測による低遅延化
- 通信予測機構を用いた低遅延ネットワークの構成方法と評価(予測及び通信機構)
- 1A-6 メニーコアプロセッサにおけるSmartCoreシステムを用いたReactive NUCAの実装の検討(計算機アーキテクチャ,一般セッション,アーキテクチャ,情報処理学会創立50周年記念)
- Feature-Packing のためのソフトウェアによるメモリ管理手法の実装と評価
- SmartCore システムによるメニーコアプロセッサの信頼性向上手法
- メニーコアアーキテクチャ研究のためのスケーラブルなHW評価環境 ScalableCore システム
- 細粒度自動並列化に基づくマルチプロセッサ向けの移植性の高いバックエンドの構成
- A-3-4 MICSを用いたシステムアーキテクチャ設計手法の検討と評価(A-3.VLSI設計技術,一般講演)
- A-3-1 低消費電力のための細粒度並列化におけるデータ転送回数の削減(A-3.VLSI設計技術,一般講演)
- A-3-16 柔軟なシステム設計のためのシミュレーション環境MICSの動作速度の評価(A-3.VLSI設計技術,一般講演)
- A-3-4 動的再構成可能プロセッサのためのコンテクスト自動抽出とプログラムの等価変換による改善の検討(A-3.VLSI設計技術,一般講演)
- A-3-2 確率モデルにもとづく細粒度自動並列化コンパイラの検討(A-3.VLSI設計技術,一般講演)
- 三次元表現空間を用いたプログラムの解析と並列化の一手法
- A-3-2 可変論理プロセッサへの演算器のマッピング問題について(A-3.VLSI設計技術,基礎・境界)
- データドリブンに基づくバス解析の一手法
- 間接アドレッシングDSPのための複数同時データ転送を考慮したメモリ配置手法
- ルールベースアクセス制御機能を持つDLNA情報家電の遠隔共有支援機構
- 2ZP-3 資源情報の特徴抽出によるモデル化手法と攻撃検知法の提案(情報爆発時代における分散処理と運用技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- B-022 GCCによるキュー・コンパイラ開発手法の提案(B分野:ソフトウェア)
- 耐故障・適応ルーティングのセルフチューニングに関する検討
- 耐故障・適応ルーティングのセルフチューニングに関する検討
- 耐故障・適応ルーティングのセルフチューニングに関する検討(ディペンダブルコンピュータシステム及び一般)
- 耐故障・適応ルーティングのセルフチューニングに関する検討(ディペンダブルコンピュータシステム及び一般)
- キャンパスP2Pネットワークにおけるパーソナライズド検索(ネットワーク, 組込技術とネットワークに関するワークショップ)
- キャンパスP2Pネットワークにおけるパーソナライズド検索
- 耐故障性を考慮したk-ary n-cube用適応デッドロック回復ルーティング(ネットワーク)
- C-029 Verilog-HDLによる並列キュープロセッサのデザイン(C.アーキテクチャ・ハードウェア)
- 並列キュー計算モデルの基本特性評価(CPSY-3 性能評価)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 動的故障に対応する並列計算機用適応ルータに関する検討(ディペンダブルコンピュータシステム及び一般)
- JXTAネットワークに対するユーザ認証およびアクセス制御の導入
- Qjavaプロセッサの基本設計(デペンダブルコンピュータシステム及び一般)
- QJavaプロセッサの基本設計(ディペンダブルコンピュータシステム及び一般)
- 予測ルータによる低遅延 Fat Tree ネットワーク
- Recover-x適応ルーティング(並列処理)
- 並列デッドロック回復ルータRecover-xの性能評価
- スケーラブルFPGAシステムにおけるハードウェア拡張方式
- FPGAを用いたデータストリームに対するウィンドウジョインの検討(FPGAアクセラレーター,FPGA応用及び一般)
- FPGAを用いたデータストリームに対するウィンドウジョインの検討(FPGAアクセラレーター,FPGA応用及び一般)
- FPGAを用いたデータストリームに対するウィンドウジョインの検討(FPGAアクセラレーター,FPGA応用及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法
- ウィンドウ結合演算子のFPGAによる実現(スマートな社会を支えるインターネットアーキテクチャ論文)
- MPI埋め込み可能GPUプログラミングフレームワーク適用可能性の評価(並列処理支援,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- JavaRockを用いたHW/SW協調設計の検討 (リコンフィギャラブルシステム)
- プログラミング言語JavaのFPGA向け高位合成言語としての利用の検討(設計手法及び一般,デザインガイア2011-VLSI設計の新しい大地-)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法