SMTプロセッサにおける同期方式の検討(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
スポンサーリンク
概要
- 論文の詳細を見る
Simultaneous MultiThreading(SMT)プロセッサは, 複数の命令流が計算機資源(各種演算器やキャッシュメモリ)を共有して並列実行することでプロセッサの利用率を向上させる. 並列計算では同期オーバヘッド削減が重要であるが, SMTプロセッサでは並列実行する命令流がチップ内にあるということを利用した同期の最適化が可能であり, すでにSMT-blockという軽量な同期手法が提案されている. しかし, これを実現するための命令が複雑である点などから, 提案されている手法をそのまま適用することは困難である. そこで, 本稿ではSMT-blockを実現する命令セットについて再検討し, より単純なものにした. また, この機構を利用してさらに同期オーバヘッドを削減する手法であるロック獲得予約を提案する. 評価の結果, 改良した命令セットでもSMT-blockと同様の性能改善が見られた. また, ロック獲得予約を利用した場合, 通常のSMT-blockを利用したプログラムと比較して最大6%の性能向上を実現することができた.
- 一般社団法人情報処理学会の論文
- 2005-03-07
著者
-
中條 拓伯
東京農工大学
-
並木 美太郎
東京農工大学
-
佐藤 未来子
東京農工大学大学院工学府情報工学専攻
-
加藤 義人
東京農工大学大学院工学教育部:(現)ソニー株式会社
-
内倉 要
東京農工大学大学院工学教育部
-
笹田 耕一
東京農工大学大学院工学教育部
-
大和 仁典
東京農工大学大学院工学教育部
-
笹田 耕一
東京大学大学院情報理工学系研究科
-
笹田 耕一
東京農工大学大学院工学府
-
笹田 耕一
東京大学:(現)東京大学大学院情報理工学系研究科創造情報学専攻
-
佐藤 未来子
東京農工大学大学院工学府
-
大和 仁典
東京農工大学大学院工学教育部:(現)株式会社東芝
-
内倉 要
東京農工大学大学院:(現)(株)小松製作所
-
中條 拓伯
東京農工大
-
大和 仁典
東京農工大学 大学院 工学教育部
-
加藤 義人
東京農工大学 大学院 工学教育部
-
佐藤 未来子
東京農工大学
関連論文
- 大容量データ向け対話的実時間遠隔可視化装置の実現性検討(ストレージと可視化,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの予備評価(高性能計算とアクセラレータ)
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- スケーラブルFPGAシステムにおけるハードウェア拡張方式 (リコンフィギャラブルシステム)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション (コンピュータシステム)
- 経験的モード分解を用いた雑音環境下における警笛抽出手法 (産業計測制御研究会 モーションコントロール、センサ応用、信号処理応用、生体信号処理など)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- DIMMnet-3ネットワークインタフェースにおけるMPI支援機能(ARC-6:相互結合網,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- DIMMnet-2ネットワークインタフェースコントローラの設計と実装(HPCハードウェア)
- DIMMスロット装着型デバイスDIMMnet-2の改良方針(ARC-7: ネットワークインタフェースとルーティング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- RC-005 DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(ハードウェア・アーキテクチャ,査読付き論文)
- 経験的モード分解を用いた雑音環境下における警笛抽出手法
- DIMMnet通信インタフェース用パケット伝送レイヤ
- bDais : DIMMnet-1/InfiniBand間ルータの評価(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- コモディティOSとメモリマップによるクラスタシステムの実装
- DIMMnet-2 NICのTCP/IPプロトコルスタック用ネットワークドライバの実装と評価
- DIMMnet-2用Windowsドライバの実装と評価
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMスロット搭載型ネットワークインタフェースDIMMnetにおけるスレッドライブラリ(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- DIMMスロット搭載型ネットワークインタフェースDIMMnetにおけるスレッドライブラリ
- SMTプロセッサにおけるスレッドスケジューラの開発(マルチスレッド)
- SMTプロセッサにおける再構成可能キャッシュモデルとFPGAによる実装
- FPGAを用いたSMTプロセッサの実現と再構成可能キャッシュメモリの検討(設計手法と高性能化, リコンフィギャラブルシステム, 一般)
- SMTプロセッサにおける同期方式の検討(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- SMTプロセッサにおける同期方式の検討
- SMTプロセッサにおける細粒度最適化手法の検討(ARC-3 : プロセッサアーキテクチャIII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- SMTプロセッサにおける物理レジスタバンクの動的割当て
- SMTプロセッサにおけるスレッドスケジューラの開発(スレッド・プロセス)
- マルチスレッドアーキテクチャ向けOS「Future」におけるプロセス管理
- マルチスレッドアーキテクチャにおけるスレッドライブラリの実装と評価(プロセッサアーキテクチャ)
- SMTプロセッサにおけるアウトオブオーダ実行に必要なリソースの共有方式の評価(ARC-1:プロセッサ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- スレッド管理機構を用いたオンチップマルチスレッドのためのキャッシュメモリシステム
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- マルチスレッドアーキテクチャOChiMuS PE向けシステムソフトウェアにおけるスレッド固有メモリの管理方式(システムプログラム)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の通信性能評価
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- DIMMnet-2ネットワークインタフェースボードの試作(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- Gather機能付き拡張メモリのアクセス性能の評価
- Gather機能付き拡張メモリのアクセス性能の評価
- キャッシュを用いたレジスタ・マップ表の回路面積削減
- 選択的キャッシュ・アロケーション:マルチスレッド環境におけるキャッシュ利用効率の向上手法
- メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ベクトルアクセス機構を有するメモリモジュールによる不連続なDMAの効率化
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- MPI派生データ型通信支援機構のDIMMnet-2への実装と評価(ネットワーク)
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ハードウエアによるMPI派生データ型通信の支援(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化
- メッセージパッシングモデルを支援するパケット受信機構のDIMMnet-2への実装と評価(ネットワーク)
- メッセージパッシングモデルを支援するパケット受信機構の実装(一般セッションC 設計と実装)
- DIMMnet-2ネットワークインタフェースにおけるプリフェッチ機構の実装と評価
- メモリモジュール上での等間隔アクセス連続化の効果(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- メモリモジュール上での等間隔アクセス連続化の効果
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- SMTプロセッサにおけるL1/L2キャッシュアクセス動的切替え方式
- SMTプロセッサにおけるキャッシュリプレース動的切替え方式(プロセッサアーキテクチャ)
- 携帯機器を用いた高密度ネットワークによる並列分散処理
- SMTプロセッサにおけるキャッシュメモリリプレース方式の動的切り替え(SMTプロセッサと専用ハードウェア)
- SMTプロセッサ向けキャッシュメモリリプレース方式(プロセッサアーキテクチャ)
- マルチスレッドプロセッサにおける再構成可能キャッシュメモリ
- FPGAにおけるSMTプロセッサの実装モデル
- SMTプロセッサ向けの軽量な同期機構(プロセッサアーキテクチャ)
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の試作
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその低遅延通信機構AOTF(高性能アーキテクチャ)
- DIMMnet-1におけるMartiniオンチッププロセッサによる通信の性能評価
- DIMMnet-1プロトタイプによるバンド幅と大域演算性能の評価
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその高バンド幅通信機構BOTF(並列処理)
- Webコミュニティ探索のための量子アルゴリズムの提案と検証
- 量子コンピュータ実現に向けた量子命令セットについて(量子計算)
- シミュレーション試行を前提とした量子コンピュータ・アーキテクチャ
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- プリフェッチ機能を有するメモリモジュールによるPC上での間接参照の高速化(HPCハードウェア)
- B-003 NAS CGベンチマークによるプリフェッチ機能付きメモリモジュールの性能評価(B.ソフトウェア)
- メモリスロットインタフェースの得失(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- プリフェッチ機能付きメモリモジュールによる不連続アクセスの連続化(高速化手法)
- プリフェッチ機能を有するメモリモジュール(ARC-8:メモリシステム)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- SMTプロセッサにおける同期方式の検討(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- スケジュールド命令キャッシュを用いた高速な命令供給手法
- 分岐予測精度改善のための決定的な分岐フィルタ機構(ARC-4:分岐予測,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- InfiniBand Verb層を利用したソフトウェア分散共有メモリシステムFagusの実装と評価
- EPGA実装型光通信ネットワークインタフェースによるソフトウェア分散共有メモリシステムの実装と評価
- Simultaneous Multithread (SMT) アーキテクチャの現状と今後
- メモリモジュール上での等間隔アクセス連続化の効果(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))