Simultaneous Multithread(SMT)アーキテクチャの実現方式(<特集>並列処理)
スポンサーリンク
概要
- 論文の詳細を見る
我々はSMTアーキテクチャをベースにしたプロセッサα-Coralの実現を試み,効率の良いスレッド実行環境の構築を目指す.α-Coralでは,コンパイラによりプログラム内の並列実行可能なスレッドを抽出し,それらの同時実行や高速切替えなどのサポートをハードウェアにより行う.α-Coralはコンパイラの生成するさまざまな粒度のスレッドを効率良く実行するためのスレッド制御命令を有し,一部のレジスタを共有することにより,少ない遅延でのスレッド間通信を実現している.本論文ではα-Coralのアーキテクチャについて述べ,その性能をシミュレーションにより評価した結果,シングルスレッドのプログラムと比べ,同一環境下でもプログラムにマルチスレッド化を施した場合は速度向上がみられることが確認できた.
- 2002-04-15
著者
-
中條 拓伯
東京農工大学
-
河原 章二
東京農工大学大学院工学研究科電子情報工学専攻
-
中條 拓伯
東京農工大学工学部情報コミュニケーション工学科
-
中條 拓伯
東京農工大
-
Yankelevsky Mark
Center far Supeecomputing Research and Development, University of Illinois at Urbana Champaign
-
Polychronopoulos Constantine
Center far Supeecomputing Research and Development, University of Illinois at Urbana Champaign
-
Yankelevsky Mark
Center Far Supeecomputing Research And Development University Of Illinois At Urbana Champaign
-
Polychronopoulos Constantine
Center Far Supeecomputing Research And Development University Of Illinois At Urbana Champaign
関連論文
- 大容量データ向け対話的実時間遠隔可視化装置の実現性検討(ストレージと可視化,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの予備評価(高性能計算とアクセラレータ)
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- スケーラブルFPGAシステムにおけるハードウェア拡張方式 (リコンフィギャラブルシステム)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション (コンピュータシステム)
- 経験的モード分解を用いた雑音環境下における警笛抽出手法 (産業計測制御研究会 モーションコントロール、センサ応用、信号処理応用、生体信号処理など)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- DIMMnet-3ネットワークインタフェースにおけるMPI支援機能(ARC-6:相互結合網,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- DIMMnet-2ネットワークインタフェースコントローラの設計と実装(HPCハードウェア)
- DIMMスロット装着型デバイスDIMMnet-2の改良方針(ARC-7: ネットワークインタフェースとルーティング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- RC-005 DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(ハードウェア・アーキテクチャ,査読付き論文)
- 経験的モード分解を用いた雑音環境下における警笛抽出手法
- DIMMnet通信インタフェース用パケット伝送レイヤ
- bDais : DIMMnet-1/InfiniBand間ルータの評価(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- コモディティOSとメモリマップによるクラスタシステムの実装
- DIMMnet-2 NICのTCP/IPプロトコルスタック用ネットワークドライバの実装と評価
- DIMMnet-2用Windowsドライバの実装と評価
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMスロット搭載型ネットワークインタフェースDIMMnetにおけるスレッドライブラリ(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- DIMMスロット搭載型ネットワークインタフェースDIMMnetにおけるスレッドライブラリ
- SMTプロセッサにおけるスレッドスケジューラの開発(マルチスレッド)
- SMTプロセッサにおける再構成可能キャッシュモデルとFPGAによる実装
- FPGAを用いたSMTプロセッサの実現と再構成可能キャッシュメモリの検討(設計手法と高性能化, リコンフィギャラブルシステム, 一般)
- SMTプロセッサにおける同期方式の検討(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- SMTプロセッサにおける同期方式の検討
- SMTプロセッサにおける細粒度最適化手法の検討(ARC-3 : プロセッサアーキテクチャIII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- SMTプロセッサにおける物理レジスタバンクの動的割当て
- SMTプロセッサにおけるスレッドスケジューラの開発(スレッド・プロセス)
- マルチスレッドアーキテクチャ向けOS「Future」におけるプロセス管理
- マルチスレッドアーキテクチャにおけるスレッドライブラリの実装と評価(プロセッサアーキテクチャ)
- SMTプロセッサにおけるアウトオブオーダ実行に必要なリソースの共有方式の評価(ARC-1:プロセッサ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- スレッド管理機構を用いたオンチップマルチスレッドのためのキャッシュメモリシステム
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- マルチスレッドアーキテクチャOChiMuS PE向けシステムソフトウェアにおけるスレッド固有メモリの管理方式(システムプログラム)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の通信性能評価
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- DIMMnet-2ネットワークインタフェースボードの試作(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- Gather機能付き拡張メモリのアクセス性能の評価
- Gather機能付き拡張メモリのアクセス性能の評価
- キャッシュを用いたレジスタ・マップ表の回路面積削減
- 選択的キャッシュ・アロケーション:マルチスレッド環境におけるキャッシュ利用効率の向上手法
- メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ベクトルアクセス機構を有するメモリモジュールによる不連続なDMAの効率化
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- MPI派生データ型通信支援機構のDIMMnet-2への実装と評価(ネットワーク)
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ハードウエアによるMPI派生データ型通信の支援(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化
- メッセージパッシングモデルを支援するパケット受信機構のDIMMnet-2への実装と評価(ネットワーク)
- メッセージパッシングモデルを支援するパケット受信機構の実装(一般セッションC 設計と実装)
- DIMMnet-2ネットワークインタフェースにおけるプリフェッチ機構の実装と評価
- メモリモジュール上での等間隔アクセス連続化の効果(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- メモリモジュール上での等間隔アクセス連続化の効果
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- SMTプロセッサにおけるL1/L2キャッシュアクセス動的切替え方式
- SMTプロセッサにおけるキャッシュリプレース動的切替え方式(プロセッサアーキテクチャ)
- 携帯機器を用いた高密度ネットワークによる並列分散処理
- SMTプロセッサにおけるキャッシュメモリリプレース方式の動的切り替え(SMTプロセッサと専用ハードウェア)
- SMTプロセッサ向けキャッシュメモリリプレース方式(プロセッサアーキテクチャ)
- マルチスレッドプロセッサにおける再構成可能キャッシュメモリ
- FPGAにおけるSMTプロセッサの実装モデル
- SMTプロセッサ向けの軽量な同期機構(プロセッサアーキテクチャ)
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の試作
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその低遅延通信機構AOTF(高性能アーキテクチャ)
- DIMMnet-1におけるMartiniオンチッププロセッサによる通信の性能評価
- DIMMnet-1プロトタイプによるバンド幅と大域演算性能の評価
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその高バンド幅通信機構BOTF(並列処理)
- Webコミュニティ探索のための量子アルゴリズムの提案と検証
- 量子コンピュータ実現に向けた量子命令セットについて(量子計算)
- シミュレーション試行を前提とした量子コンピュータ・アーキテクチャ
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- プリフェッチ機能を有するメモリモジュールによるPC上での間接参照の高速化(HPCハードウェア)
- B-003 NAS CGベンチマークによるプリフェッチ機能付きメモリモジュールの性能評価(B.ソフトウェア)
- メモリスロットインタフェースの得失(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- プリフェッチ機能付きメモリモジュールによる不連続アクセスの連続化(高速化手法)
- プリフェッチ機能を有するメモリモジュール(ARC-8:メモリシステム)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- SMTプロセッサにおける同期方式の検討(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- スケジュールド命令キャッシュを用いた高速な命令供給手法
- 分岐予測精度改善のための決定的な分岐フィルタ機構(ARC-4:分岐予測,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- InfiniBand Verb層を利用したソフトウェア分散共有メモリシステムFagusの実装と評価
- EPGA実装型光通信ネットワークインタフェースによるソフトウェア分散共有メモリシステムの実装と評価
- Simultaneous Multithread (SMT) アーキテクチャの現状と今後
- メモリモジュール上での等間隔アクセス連続化の効果(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))