超並列テラフロップスマシンTS/1の構想
スポンサーリンク
概要
- 論文の詳細を見る
1993年4月よりRWC(Real World Computing)プロジェクトの一環としてRWC東芝超並列研究室はピーク性能20TFLOPSを実現可能な超並列計算機TS/1の開発を開始した.本稿ではTS/1のアーキテクチャの全体像について概要を報告する.TS/1は三次元実装によって接続される最大構成時65,536台のR4000タイプのマイクロプロセッサとTSC1コプロセッサと64MB同期DRAMにより構成されるノードからなる.TSC1は(1)ピーク速度250MFLOPSのマルチスレッデッドベクトルプロセッサ,(2)遠隔のFIFO型ベクトルレジスタ間のチェイニング機構(プロセッサ間チェイニング機構),(3)1GB/s/nodeのメモリバンド幅を実現する同期型DRAMのためのブロック化メモリアクセス機構,(4)仮想記憶をサポートした分散共有メモリアクセス機構,(5)3GB/s/nodeの結合網バンド幅を実現する三次元トーラス用フォールトトレラントなwormhole型ルータを内蔵する.
- 1993-08-19
著者
-
田邊 昇
(株)東芝研究開発センター
-
田邊 昇
(株)東芝
-
菅野 伸一
(株)東芝研究開発センター
-
小柳 滋
(株)東芝
-
鈴木 真樹
(株)東芝
-
鈴木 真樹
(株)東芝研究開発センター
-
小柳 滋
(株)東芝研究開発センター
関連論文
- 大容量データ向け対話的実時間遠隔可視化装置の実現性検討(ストレージと可視化,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの予備評価(高性能計算とアクセラレータ)
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- base-m n-cubeの実現方式に関するシミュレーション
- 並列AIマシンProdigyの視覚的デバッガ(VDB)
- 並列AIマシンProdigyのハードウェア構成
- 並列AIマシンProdigyの応用(2) : 並列意味ネットワーク向き外延的知識の表現方法
- 並列AIマシンProdigyの応用(1) : 並列プロダクションシステムの実現と評価
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- DIMMnet-3ネットワークインタフェースにおけるMPI支援機能(ARC-6:相互結合網,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- DIMMnet-2ネットワークインタフェースコントローラの設計と実装(HPCハードウェア)
- DIMMスロット装着型デバイスDIMMnet-2の改良方針(ARC-7: ネットワークインタフェースとルーティング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- RC-005 DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(ハードウェア・アーキテクチャ,査読付き論文)
- DIMMnet通信インタフェース用パケット伝送レイヤ
- bDais : DIMMnet-1/InfiniBand間ルータの評価(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 高性能計算をサポートするネットワークインタフェース用コントローラチップMartini
- RHiNET/MEMOnetネットワークインタフェース用コントローラチップMartiniの予備評価
- RHINETの概要とMartiniの設計/実装
- 高速性と柔軟性を併せ持つネットワークインタフェース用チップ:Martini
- コモディティOSとメモリマップによるクラスタシステムの実装
- DIMMnet-2用Windowsドライバの実装と評価
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の通信性能評価
- B-5-79 ソフトウェア無線機におけるソフトウェア実行形態に関する提案
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- DIMMnet-2ネットワークインタフェースボードの試作(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- MPI派生データ型通信支援機構のDIMMnet-2への実装と評価(ネットワーク)
- メモリスロット直結型ネットワークインタフェースへのマルチキャストの実装と評価
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ハードウエアによるMPI派生データ型通信の支援(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化
- メッセージパッシングモデルを支援するパケット受信機構のDIMMnet-2への実装と評価(ネットワーク)
- メッセージパッシングモデルを支援するパケット受信機構の実装(一般セッションC 設計と実装)
- DIMMnet-2ネットワークインタフェースにおけるプリフェッチ機構の実装と評価
- メモリモジュール上での等間隔アクセス連続化の効果(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- メモリモジュール上での等間隔アクセス連続化の効果
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の試作
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその低遅延通信機構AOTF(高性能アーキテクチャ)
- DIMMnet-1におけるMartiniオンチッププロセッサによる通信の性能評価
- DIMMnet-1プロトタイプによるバンド幅と大域演算性能の評価
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその高バンド幅通信機構BOTF(並列処理)
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- プリフェッチ機能を有するメモリモジュールによるPC上での間接参照の高速化(HPCハードウェア)
- B-003 NAS CGベンチマークによるプリフェッチ機能付きメモリモジュールの性能評価(B.ソフトウェア)
- メモリスロットインタフェースの得失(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- プリフェッチ機能付きメモリモジュールによる不連続アクセスの連続化(高速化手法)
- プリフェッチ機能を有するメモリモジュール(ARC-8:メモリシステム)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- ストリーム信号処理用マルチスレッドプロセッサのアーキテクチャ(実時間処理,組込システム及び一般)
- ストリーム信号処理用マルチスレッドプロセッサのアーキテクチャ(実時間処理,組込システム及び一般)
- D-6-4 リアルタイム処理用マルチスレッドプロセッサの性能評価(D-6. コンピュータシステム)
- D-6-3 リアルタイム処理用マルチスレッドプロセッサのシミュレータの実装および評価(D-6. コンピュータシステム)
- 1B-3 ホームサーバにおけるストレージ記録管理方法
- 問題対応型データマイニング : 小売業への適用 (データウェアハウスとデータマイニング)
- DIMMnet-2ネットワークインタフェースにおけるプリフェッチ機構の実装と評価(ネットワークインタフェースとルーティング)
- DIMMnet-2低遅延通信機構の実装と評価(ネットワークインタフェースとルーティング)
- メモリモジュール上での等間隔アクセス連続化の効果(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- メモリスロット装着型ネットワークインタフェースDIMMnet-2の構想
- DIMMnetネットワーク接続動作検証環境
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- A-11 高速通信インタフェースDIMMnet-1での並列アプリケーションによる評価(PCクラスタ,A.アルゴリズム・基礎)
- A-10 高速通信インタフェースDIMMnet-1の通信バンド幅評価(PCクラスタ,A.アルゴリズム・基礎)
- メモリスロットに塔載されるNICのクラスタ性能予測
- マルチメディアサーバ スマートストリーマ (4) : ネットワークインタフェース制御
- マルチメディアサーバ「スマートストリーマ」のアーキテクチャ
- メモリスロット搭載型ネットワークインタフェースDIMMnet-1における細粒度通信機構
- メモリスロット搭載型ネットワークインタフェースDIMMnet-1における細粒度通信機構
- メモリスロットに搭載されるネットワークインタフェースMEMnet
- 高性能クラスタ構築用ハードウェアの現状と展望(ハードウェアとOS,SANを用いた高性能コンピュータシステム,及び一般)
- コンピュータシステムの変遷 大きさと性能が反比例する技術を中心に
- 超並列テラフロップスマシンTS/1の構想
- 時間的局所性を考慮した疎行列のキャッシュ適合性
- 時間的局所性を考慮した疎行列のキャッシュ適合性
- 疎行列のキャッシュ適合性に基づくGraph500ベンチマークの特性解析
- Graph500のHybrid解法に内在する局所性