OpenCL互換アクセラレータのマルチノード環境における開発負担軽減のためのミドルウェアの実装
スポンサーリンク
概要
- 論文の詳細を見る
GPU 等のアクセラレータを搭載したクラスタにおける並列プログラミングは,一般に CUDA や OpenCL 等のノード内における並列ライブラリと,MPI 等のノード間通信のライブラリを組み合わせることにより行われる.よって,2 種類の並列プログラミングの知識?技術の習得が不可欠であり,また,開発の過程において,OpenCL アプリケーションのノード間通信ライブラリ使用に対するコードの変換も必要である.今回我々のグループは,ネットワーク上の複数のノードに搭載された OpenCL アクセラレータ (以下,アクセラレータ) が仮想的に一つのホストマシンに多数のアクセラレータが搭載されているかのように見せかけ,OpenCL のみで記述できる環境?ライブラリを提案する.このライブラリにより,プログラム開発者は OpenCL のみで開発を行うことができ, 1 台のノード用に記述した OpenCL アプリケーションを容易にマルチノード環境で実行することが可能となる.本環境の性能評価の結果,仮想 OpenCL を用いて直交格子法による移流項を計算したところ,最大で 2 ノードを用いて 1.9 倍,3 ノードを用いて 2.5 倍性能の向上を確認した.
- 2010-12-09
著者
-
西川 由理
慶應義塾大学大学院理工学研究科
-
天野 英晴
慶應義塾大学大学院理工学研究科
-
設樂 明宏
慶應義塾大学理工学部
-
吉見 真聡
同志社大学理工学部
-
天野 英晴
慶應義塾大学
-
天野 英晴
慶應義塾大学理工学部情報工学科
-
吉見 真聡
Faculty Of Science And Engineering Doshisha University
-
山田 昌弘
慶応義塾大学理工学部
-
西川 由理
慶応義塾大学理工学部
-
鎌田 俊昭
慶應義塾大学理工学部
-
山田 昌弘
慶應義塾大学理工学部
-
天野 英晴
慶應義塾大学理工学部
-
吉見 真聡
Department Of Science And Engineering Doshisha University
-
天野 英晴
慶應義塾大学 理工学部
-
吉見 真聡
同志社大学工学部
-
吉見 真聡
同志社大学 理工学部
-
吉見 真聡
同志社大学
-
設樂 明宏
慶應義塾大学大学院理工学研究科
-
山田 昌弘
慶應義塾大学大学院理工学研究科
関連論文
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(計算機システム)
- 5K-7 省電力MIPSプロセッサコア評価のための計算機システムのFPGAによる試作(マルチスレッドと省電力,学生セッション,アーキテクチャ)
- FPGAアレイCubeを用いたレーベンシュタイン距離計算の性能評価(応用1)
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ClearSpeed製SIMD型マルチコアプロセッサにおける並列アプリケーション実行時間予測手法の検討(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ClearSpeed製コプロセッサの並列ベンチマークによる性能評価と性能向上手法の提案(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- Cell Broadband Engineを用いたスレッド仮想化環境の提案 (コンピュータシステム)
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 動的リコンフィギャラブルデバイスにおける電力分析と低電力化手法の検討(コンピュータシステム)
- ClearSpeed製SIMDプロセッサの通信性能評価(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ハイパフォーマンスコアとローパワーコアの組み合わせにおける細粒度動的スリープ制御の実装と評価(組込みシステムプラットフォーム)
- Network-on-Chipにおけるエラー検出・訂正方式に関する研究(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- DIMMnet-3ネットワークインタフェースにおけるMPI支援機能(ARC-6:相互結合網,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- DIMMnet-2ネットワークインタフェースコントローラの設計と実装(HPCハードウェア)
- DIMMスロット装着型デバイスDIMMnet-2の改良方針(ARC-7: ネットワークインタフェースとルーティング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- マルチパスイーサネットにおけるOn/Offリンクアクティベーション法の評価(ネットワーク,クラウド及び一般)
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- 動的リコンフィギャラブルデバイスにおける構成情報配送のためのマルチキャスト手法の検討(コンピュータシステム)
- Dua-Vthセルの利用による動的リコンフィギャラブルプロセッサのリーク電力削減の評価(デバイスアーキテクチャ1)
- 動的リコンフィギャラブルプロセッサMuCCRA-3の実機評価(リコンフィギャラブルアーキテクチャ)
- FPGAを用いた汎用生化学シミュレータにおけるハードウェアモジュール自動生成アルゴリズムの実機評価(リコンフィギャラブル応用)
- CFD専用計算機FLOPS-2Dへ向けたUPACS制限関数群モジュール化の検討(リコンフィギャラブル応用)
- FPGAによるUPACSサブルーチンの高速化(リコンフィギャラブル応用)
- 低遅延オンチップネットワークのための予測ルータの評価(組込みシステムプラットフォーム)
- 並列計算機ASCAの要素プロセッサによる近細粒度並列処理
- C言語実装を用いたインタプリタ方式の命令エミュレーション性能の向上(コンピュータシステム)
- 低エネルギーを目的とした大規模リコンフィギャラブルプロセッサアレイSMAの予備評価(リコンフィギャラブルアーキテクチャ,デザインガイア2008-VLSI設計の新しい大地)
- Rearrangeable NoC:配線遅延を考慮した分散ルータアーキテクチャ(Inventive and Creative Architecture特別セッションIII)
- 省電力MIPSプロセッサにおけるOSの試作とシミュレーションによる電力評価(セッション7:資源管理)
- 性能予測モデルの学習と実行時性能最適化機構を有する省電力化スケジューラ(省電力方式)
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(低消費電力)
- スーパースカラプロセッサにおける細粒度動的スリープ制御の実装と評価(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- MIPS R3000における細粒度動的スリープ方式の提案(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- MIPS R3000における細粒度動的スリープ方式の提案(低消費電力化技術(1),集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- スレッドレベル並列性を活かす科学技術計算用FPGAシステムの提案(Inventive and Creative Architecture特別セッションIII)
- FPGAを用いた生化学シミュレータにおける反応速度式の類似性に着目した演算パイプライン自動結合アルゴリズム(リコンフィギャラブル応用)
- FPGA上でのシミュレーションに向けた生化学モデルコンパイラの実装(コンピュータシステム)
- FPGAを用いた生化学シミュレータにおける入力ポート制約を考慮した演算パイプラインスケジューリング(応用3)
- 高速アルゴリズムを適用したデータ駆動型確率モデル生化学シミュレータのFPGAへの実装と評価(応用事例,デザインガイア2007-VLSI設計の新しい大地を考える研究会)
- 生化学シミュレータReCSiPにおける反応速度式共有化(アプリケーション,リコンフィギャラブルシステム,一般)
- FPGAを用いた確率モデル生化学シミュレータ(リコンフィギャラブルシステム)
- FPGAを用いた確率モデル生化学シミュレータ
- FPGAを用いた汎用生化学シミュレータReCSiP(応用技術,リコンフィギャラブルシステム論文)
- ReCSiPボードにおける汎用ホストインターフェイスの実装と評価(リコンフィギャラブルシステム,一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- Cell Broadband Engineを用いたスレッド仮想化環境の提案(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- FPGAを用いた生化学シミュレータ向けSBML処理系の構築(リコンフィギャラブル応用I)
- ClearSpeed製コプロセッサの並列ベンチマークによる性能評価と性能向上手法の提案(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- OpenCL互換アクセラレータのマルチノード環境における開発負担軽減のためのミドルウェアの実装
- OpenCL互換アクセラレータのマルチノード環境における開発負担軽減のためのミドルウェアの実装
- ストリームアプリケーション向け大規模FPGAアレイCUBEの性能評価
- 単フリット・単サイクルルータを用いたNoC向け非最短完全適応型ルーティング
- Cell Broadband Engine向けオフロード機構の提案
- InfiniBandとEthernetの混在環境でのクラスタノード間通信に関する提案
- Cell Broadband Engineを用いたスレッド仮想化環境の提案(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャ,FPGA応用及び一般)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャー,FPGA応用及び一般)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャ,FPGA応用及び一般)
- Cellクラスタにおけるスレッド仮想化環境に用いるキャッシュ機構の実装
- FPGAを用いた高スループット確率モデル生化学シミュレータの設計と評価
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案(高信頼化技術・設計技術)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- Cell クラスタにおけるスレッド仮想化環境に用いるキャッシュ機構の実装
- Cell Broadband Engine 向けオフロード機構の提案
- Cell Broadband Engineを用いたphoton mappingの実装と評価(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- RC-012 FPGAに基づく生化学シミュレータにおける反応速度式の類似性に着目したパイプライン自動構築(ハードウェア・アーキテクチャ,査読付き論文)
- FPGAを用いた生化学シミュレータReCSiPのシミュレーション制御機構(リコンフィギャラブル応用I)
- InfiniBand と Ethernet の混在環境でのクラスタノード間通信に関する提案
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案
- 1-flit パケット構造を利用した非最短型完全適応ルーティング
- 1-flit パケット構造を利用した非最短型完全適応ルーティング
- アクセラレータを搭載した PC クラスタのための仮想環境の実装と評価
- Cell Broadband Engine を用いたスレッド仮想化環境の提案
- Cell Broadband Engineクラスタにおける開発負担軽減のためのミドルウェアの実装と評価(コンピュータシステム,FPGA応用及び一般)
- Cell Broadband Engineクラスタにおける開発負担軽減のためのミドルウェアの実装と評価(コンピュータシステム,FPGA応用及び一般)
- Cell Broadband Engineクラスタにおける開発負担軽減のためのミドルウェアの実装と評価(コンピュータシステム,FPGA応用及び一般)
- ネットワーク混合型Cell/B.E.のHigh Performance Linpackにおける評価(並列処理技術,組込み技術とネットワークに関するワークショップETNET2011)
- ネットワーク混合型Cell/B.E.のHigh Performance Linpackにおける評価(並列処理技術,組込み技術とネットワークに関するワークショップETNET2011)