ClearSpeed製コプロセッサの並列ベンチマークによる性能評価と性能向上手法の提案(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,ClearSpeed社の開発したコプロセッサCSX600のメモリ間や計算コア間転送の性能評価,およびその結果の考察を述べる.評価には姫野ベンチマークを用い,同社により提供されるSDK(Software Developement Kit)によりCSX600向けにデータフローの異なる4種類の実装を行った.実行時間の測定結果およびプロファイリングの解析結果より,CSX600の性能は一般的なPC(Xeon 2.80GHz)の1.4倍程度であるが,これは実際の演算時間が実行時間の6.7%程度に留まることに起因する.この性能改善手法として1)ローカルメモリからメインメモリへの直接参照ならびに計算コアの同時アクセスの実現,2)アーキテクチャの側面から計算コア間のバックグラウンド転送のサポート,3)各コアの持つローカルメモリの利用率を向上させるためのコンパイラの改良の3点を示す.
- 2007-03-01
著者
-
西川 由理
慶應義塾大学大学院理工学研究科
-
鯉渕 道紘
国立情報学研究所
-
吉見 真聡
慶應義塾大学大学院理工学研究科
-
天野 英晴
慶應義塾大学大学院理工学研究科
-
吉見 真聡
同志社大学理工学部
-
天野 英晴
慶應義塾大学
-
吉見 真聡
慶應義塾大学
-
西川 由理
慶応義塾大学理工学部
関連論文
- FPGAアレイCubeを用いたレーベンシュタイン距離計算の性能評価(応用1)
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ClearSpeed製SIMD型マルチコアプロセッサにおける並列アプリケーション実行時間予測手法の検討(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ClearSpeed製コプロセッサの並列ベンチマークによる性能評価と性能向上手法の提案(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- Cell Broadband Engineを用いたスレッド仮想化環境の提案 (コンピュータシステム)
- ClearSpeed製SIMDプロセッサの通信性能評価(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- インターネットの帯域オンデマンドサービスにおけるスケジューリングアルゴリズム(ネットワーク技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- サービス指向ルータにおける高速なデータ書き込み機構の提案(ネットワーク技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- Network-on-Chipにおけるエラー検出・訂正方式に関する研究(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- マルチパスイーサネットにおけるOn/Offリンクアクティベーション法の評価(ネットワーク,クラウド及び一般)
- リッチなユーザサービスを提供するセマンティックルータにおける正規表現プロセッサの提案(オーバーレイネットワーク,VPN,DDoS,ネットワークセキュリティ,P2P通信,ネットワークソフトウェア,一般)
- FPGAを用いた汎用生化学シミュレータにおけるハードウェアモジュール自動生成アルゴリズムの実機評価(リコンフィギャラブル応用)
- 低遅延オンチップネットワークのための予測ルータの評価(組込みシステムプラットフォーム)
- Rearrangeable NoC:配線遅延を考慮した分散ルータアーキテクチャ(Inventive and Creative Architecture特別セッションIII)
- サービス指向ルータにおけるパケットストリーム解析支援(ウェブ情報とデータベースに関して(ポスター講演))
- 情報の発信・共有・検索・受信に積極的に関わるセマンティックルータ(Inventive and Creative Architecture特別セッションIII)
- リッチなユーザサービスを提供するセマンティックルータにおけるデータベースインサーションの提案(解析,一般,オーバーレイネットワーク,VPN,DDoS,ネットワークセキュリティ,P2P通信,ネットワークソフトウェア,一般)
- スレッドレベル並列性を活かす科学技術計算用FPGAシステムの提案(Inventive and Creative Architecture特別セッションIII)
- FPGAを用いた生化学シミュレータにおける反応速度式の類似性に着目した演算パイプライン自動結合アルゴリズム(リコンフィギャラブル応用)
- FPGA上でのシミュレーションに向けた生化学モデルコンパイラの実装(コンピュータシステム)
- FPGAを用いた生化学シミュレータにおける入力ポート制約を考慮した演算パイプラインスケジューリング(応用3)
- 高速アルゴリズムを適用したデータ駆動型確率モデル生化学シミュレータのFPGAへの実装と評価(応用事例,デザインガイア2007-VLSI設計の新しい大地を考える研究会)
- 生化学シミュレータReCSiPにおける反応速度式共有化(アプリケーション,リコンフィギャラブルシステム,一般)
- FPGAを用いた確率モデル生化学シミュレータ(リコンフィギャラブルシステム)
- FPGAを用いた確率モデル生化学シミュレータ
- FPGAを用いた汎用生化学シミュレータReCSiP(応用技術,リコンフィギャラブルシステム論文)
- ReCSiPボードにおける汎用ホストインターフェイスの実装と評価(リコンフィギャラブルシステム,一般)
- VLANイーサネットを用いた大規模PCクラスタの検討(ARC-10:クラスタ技術,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- リッチなユーザサービスを提供するセマンティックルータの提案(ARC-6:通信およびコンテスト報告,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- Cell Broadband Engineを用いたスレッド仮想化環境の提案(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- パケットストリーム処理における正規表現選択演算を含む問合せ最適化(コンピュータシステム技術2,組込み技術とネットワークに関するワークショップ ETNET2010)
- パケットデータ管理基盤における情報抽出処理の効率化技法(コンピュータシステム技術2,組込み技術とネットワークに関するワークショップ ETNET2010)
- 予測機構を持った低遅延オンチップルータアーキテクチャ(オンチップ・ネットワーク/メモリシステム,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- マルチパスイーサネットにおける省電力On/Offリンクアクティベーション法(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- FPGAを用いた生化学シミュレータ向けSBML処理系の構築(リコンフィギャラブル応用I)
- エラー検出・再送機能を備えた低消費電力オンチップルータの設計
- ClearSpeed製コプロセッサの並列ベンチマークによる性能評価と性能向上手法の提案(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- レイヤ1帯域オンデマンドサービスシステムの開発(ネットワーク,システム開発・ソフトウェア開発論文)
- ワイヤレス3-D NoCのための通信プロトコルの検討
- OpenCL互換アクセラレータのマルチノード環境における開発負担軽減のためのミドルウェアの実装
- OpenCL互換アクセラレータのマルチノード環境における開発負担軽減のためのミドルウェアの実装
- ストリームアプリケーション向け大規模FPGAアレイCUBEの性能評価
- CMPにおけるオンチップルータの細粒度パワーゲーティングの評価
- ルータのアクセス傾向を利用したネットワークプロセッサ搭載用キャッシュ機構
- 単フリット・単サイクルルータを用いたNoC向け非最短完全適応型ルーティング
- NoCのための多電源可変パイプラインルータ
- 誘導結合を用いたフィールドスタッカブルCMPのための3-D NoCアーキテクチャの検討
- 誘導結合を用いたフィールドスタッカブルCMPのための3-D NoCアーキテクチャの検討
- Cell Broadband Engine向けオフロード機構の提案
- コンテキストスイッチを利用したルータにおけるTCPストリーム再構築のメモリ削減手法
- InfiniBandとEthernetの混在環境でのクラスタノード間通信に関する提案
- Cell Broadband Engineを用いたスレッド仮想化環境の提案(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- パケットストリーム処理における正規表現選択演算を含む問合せ最適化(コンピュータシステム技術2,組込み技術とネットワークに関するワークショップETNET2010)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャ,FPGA応用及び一般)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャー,FPGA応用及び一般)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャ,FPGA応用及び一般)
- Cellクラスタにおけるスレッド仮想化環境に用いるキャッシュ機構の実装
- FPGAを用いた高スループット確率モデル生化学シミュレータの設計と評価
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案(高信頼化技術・設計技術)
- エラー検出・再送機能を備えた低消費電力オンチップルータの設計 (集積回路)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- パケットデータ管理基盤における情報抽出処理の効率化技法(コンピュータシステム技術2,組込み技術とネットワークに関するワークショップETNET2010)
- パケットストリームの正規表現処理を可能とするネットワークプロセッサ
- Cell クラスタにおけるスレッド仮想化環境に用いるキャッシュ機構の実装
- Cell Broadband Engine 向けオフロード機構の提案
- Cell Broadband Engineを用いたphoton mappingの実装と評価(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- RC-012 FPGAに基づく生化学シミュレータにおける反応速度式の類似性に着目したパイプライン自動構築(ハードウェア・アーキテクチャ,査読付き論文)
- FPGAを用いた生化学シミュレータReCSiPのシミュレーション制御機構(リコンフィギャラブル応用I)
- InfiniBand と Ethernet の混在環境でのクラスタノード間通信に関する提案
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案
- 1-flit パケット構造を利用した非最短型完全適応ルーティング
- 1-flit パケット構造を利用した非最短型完全適応ルーティング
- アクセラレータを搭載した PC クラスタのための仮想環境の実装と評価
- Cell Broadband Engine を用いたスレッド仮想化環境の提案
- Cell Broadband Engineクラスタにおける開発負担軽減のためのミドルウェアの実装と評価(コンピュータシステム,FPGA応用及び一般)
- Cell Broadband Engineクラスタにおける開発負担軽減のためのミドルウェアの実装と評価(コンピュータシステム,FPGA応用及び一般)
- Cell Broadband Engineクラスタにおける開発負担軽減のためのミドルウェアの実装と評価(コンピュータシステム,FPGA応用及び一般)
- ネットワーク混合型Cell/B.E.のHigh Performance Linpackにおける評価(並列処理技術,組込み技術とネットワークに関するワークショップETNET2011)
- ネットワーク混合型Cell/B.E.のHigh Performance Linpackにおける評価(並列処理技術,組込み技術とネットワークに関するワークショップETNET2011)