お茶の水1号の構成と評価
スポンサーリンク
概要
- 論文の詳細を見る
当研究室で開発中の汎用細粒度並列計算機お茶の水1号の概要を報告する.従来のバス結合型マルチプロセッサでは,低オーバーヘッドの同期・通信機構が備わっていなかったために,命令レベルの細粒度並列処理を効率よく行なうことは不可能であった.お茶の水1号では,要素プロセッサには市販の汎用高性能マイクロプロセッサを用いているが,外部の支援機構にはFPGAを用いているため,応用に適したさまざまな機構を実現することができ,細粒度並列処理の汎用テストベッドとすることができる.今回実装した機構には,1)オーバーヘッドの極めて少ないElastic Barrier,2)メモリベースの同期・通信を融合したデータ駆動同期機構,3)大規模な配列データをキャッシュ上の連続領域に効率良くフェッチする大域構造体先行フェッチ機構がある.本稿では,お茶の水1号の構造および上記の機構について述べ,細粒度並列処理における効果を考察する.
- 1993-08-19
著者
関連論文
- 難読化コンパイラのユーザによる保護強度調整機構(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 細粒度並列処理におけるレイテンシ隠蔽効果の評価
- 動的逆アセンブル手法の高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Hardwareでの動画処理における動的再構成の有意性について
- RDTネットワークにおける疑似フルマップ方式の評価
- ディレクトリキャッシュにおける疑似フルマップシステムの定量的評価
- 連載:理学のキーワード : 第29回
- プログラミング言語MLのCUDA向け拡張
- SIMD型計算機向けループ自動並列化手法
- 動的推定によるプリフェッチ量最適化
- 超並列計算機JUMP-1における分散共有メモリ管理プロセッサMBP-light(並列処理)
- Webブラウザを用いた長距離データ転送の高速化
- コヒーレントでないメモリシステムへのアーキテクチャ支援
- Ruby用仮想マシンにおけるAOTコンパイラ
- メニーコアプロセッサ向き共有キャッシュ配分方式
- マップ型履歴を用いたプリフェッチ方式とキャッシュ置換方式の協調動作
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- オフライン環境における多様性の高い実行時自己改変ソフトウェア(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 日米間QoSによるLFN高速化実験と分散KVSの構築(研究発表,ネットワーク研究開発テストベッド運用・利用,一般)
- TCPによる長距離ディスク間データ転送の高速化
- PHIGS の構造体を処理するジオメトリ演算のマルチプロセッサ上での実行効率評価
- PHlGS の構造体を処理するジオメトリ演算のマルチプロセッサ上での実行効率評価
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 部分的試行に基づく動的共有キャッシュ分割方式
- GeForce GTX 280 vs. Cell
- 置換データの性質に着目した動的キャッシュパーティショニング
- 追い出しラインに着目したプリフェッチスロットリング手法
- フィードバックを用いたハイブリッド・プリフェッチ方式
- PHIGS のジオメトリ演算のための並列処理方式の検討
- メモリアクセス列の最適化を行うメモリインタフェース
- 超並列計算機JUMP-1におけるディスク入出力サブシステムの実装
- パケット喪失履歴に基づいたTCP幅輳制御方式(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 実行パス履歴情報を利用した分岐予測手法(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- プロファイルを利用した値の局所性による高速化手法(ARC-1 : プロセッサアーキテクチャI)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- MBPコアのファームウェア設計 : 疑似フルマップ方式のサポート
- 超並列計算機JUMP-1におけるMBP-lightの性能評価
- スヌープキャッシュ制御機構の DOACROSS ループへの適用 (並列処理)
- 共有メモリ型並列計算機(並列計算機)
- RL-001 FPGAを用いた広帯域高遅延ネットワーク向けの利用可能帯域推定(L分野:ネットワーク・セキュリティ,査読付き論文)
- 4.先端グローバルR&D網の構築と国際協調アプリケーションの展開 : JGN2の国際連携活動(オープンリサーチ型次世代ネットワーク技術への挑戦-National Project JGN2 4年間のFact Sheets-)
- 分散共有メモリ型超並列計算機JUMP-1の入出力サブシステム
- XMLを用いた言語間変換
- 高性能な8倍精度浮動小数点演算機構の実現
- 多種言語処理系性能の評価に適したベンチマークプログラム
- 不要キャッシュブロックのパーティショニングによる排除方式
- HPC Ruby:静的解析に基づくRubyの高度最適化コンパイラ
- BTBへのBimode Cascading手法適用による分岐先アドレス予測の高効率化
- 多様な履歴の利用による分岐予測精度の向上
- 2010年度論文賞の受賞論文紹介 : 低次キャッシュとプリフェッチ
- ページカラーリングを応用したファイルキャッシュのページ割り当てによるキャッシュ性能の向上
- 実用的なRuby用AOTコンパイラ
- 実用並列アプリケーションの実行駆動シミュレータによる性能評価
- 例外依存関係を越える部分冗長性除去
- 実行時統計とJust-in-timeコンパイルによるロックの選択的最適化
- 細粒度並列計算機お茶の水1号 : メモリベースのデータ駆動同期機構の実現
- 動いているお茶の水1号 : 同期ビットを使用したコンパイル技法
- システムの階層的並列性を統一的に扱う最適化コンパイラ
- 細粒度並列計算機お茶の水1号 : 最適化コンパイラ
- 細粒度並列計算機用最適化コンパイラ : OP.1
- 並列処理最適化機構の実用アプリケーションを用いた性能評価
- 動いているお茶の水1号 : 大域構造体先行フェッチ機構の評価
- 細粒度並列計算機お茶の水1号 : 大域構造体先行フェッチ機構
- コード変換によるディペンダブルな分散プログラムの自動生成
- 動いているお茶の水1号 : 大域同期機構の評価
- 細粒度並列計算機お茶の水1号 : 大域同期機構
- お茶の水1号の構成と評価
- 対象粒度の異なる処理装置を複合した並列アーキテクチャ
- 最適化された応用並列計算問題における相互結合網の性能比較
- 並列計算機の結合形状評価用シミュレータ
- レイテンシ隠蔽における結合形状の評価
- 1600万計算コア超メニーコアアーキテクチャのシミュレーション
- 共有メモリ型並列計算機におけるメモリアクセスの局所化技法
- キャッシュインジェクションとメモリベース同期機構の高速化