汎用マイクロプロセッサを用いたDatarol-IIプロセッサエレメントにおける細粒度スレッド処理機構
スポンサーリンク
概要
- 論文の詳細を見る
超並列処理における重要な問題であるリモートメモリアクセスのレイテンシー問題を解決することができる細粒度マルチスレッド処理アーキテクチャ Datarol-IIを汎用マイクロプロセッサを用いて実現する方法を示した。ここで示した汎用マイクロプロセッサにスレッド処理拡張機構を付加する方式は、専用プロセッサの比べると他方性能が劣るものの、ハードウェアの作成のし易さの点で優れており、並列計算機に実用化に有用な方式であることを示した。In massively parallel processing, one of the most critical issues is the latency problem caused by remote memory accesses and remote procedure calls. To solve the problem, we have been developing a Datarol-II processor, which hide the latency effectively by sophisticated fine-grain multi-thread processing.Although the Datarol-II processor requires a great cost of its development, we can significantly reduce the development cost by replacing the thread execution unit of a Datarol-II processor with a off-the-shelf micro processor and some additional hardware for context switching. In this paper, we present the design and the performance evaluation of a Datarol-II processor based on a off-the-shelf micro processor.
- 九州大学大学院総合理工学研究科の論文
著者
関連論文
- マルチメディア指向並列計算機KUMP/Dとそのメッセージ処理機構
- 並列計算機KUMP/Dの相互結合網
- 細粒度処理向け並列計算機KUMP/Dの構造体メモリアクセス機構
- マルチメディア指向並列計算機KUMP/Dの構成と性能評価
- マルチメディア指向並列計算機KUMP/Dにおける実時間処理のための支援機構
- 細粒度マルチスレッド処理向けプロセッサDatarol-IIの構成とその評価
- マルチメディア指向並列計算機KUMP/Dの構想
- 汎用マイクロプロセッサを用いたDatarol-IIプロセッサエレメントにおける細粒度スレッド処理機構
- 並列計算機Datarol-IIのプロセッサエレメントの構成
- スレッド実行機構を導入したDatarolアーキテクチャについて
- 画像処理用超並列プロセッサAMPにおけるSimplified stream Bufferの実現