並列プログラミングフレームワークCeriumのOpenCL, CUDA対応
スポンサーリンク
概要
- 論文の詳細を見る
当研究室では、PS3, Linux 及び MacOS X 上で動作する並列プログラミングフレームワーク Cerium を提案している。MacOS X 上で GPGPU を行うには、OpenCL または CUDA を用いる方法が考えられる。OpenCL, CUDA の API に対応した API を Cerium に用意することでデータ並列に対応した。タスク並列で実行する場合、データ転送がオーバーヘッドになる。このオーバヘッドを解決するためには、kernel の実行中にデータ転送を行うことでデータ転送をオーバーラップする必要がある。OpenCL では CommandQueue、CUDA では Stream を複数用いることでデータ転送や kernel の実行を並列に行うことができる。複数の CommandQueue, Stream を用いて、自動で並列実行を行うスケジューラーを実装した。実装したスケジューラーを WordCount、FFT を例題に測定し、考察を行う。
- 2014-05-07
著者
関連論文
- Cell用のFine-grain Task Managerの実装(セッション4:マルチコア向けシステムソフトウェア)
- PlayStation 2_ Linuxにおけるネットワークゲーム用フレームワークの実装(並列・分散システム)
- PS2向きの分散ゲームオブジェクトシステムの提案
- C with Continuationと、そのPlayStationへの応用
- 同期型タプル通信を用いたマルチユーザPlayStationゲームシステム
- Continuation based CコンパイラのGCC-4.2による実装(セッション2:システム構成法)
- C with Continuationと、そのPlayStationへの応用
- 同期型タプル通信を用いたマルチユーザPlayStationゲームシステム
- 連邦型タプルスペースを使ったコンパクトルーティングの実験
- Cell Task Manager CeriumのSPU内データ管理
- Cell Task Manager CeriumのSPU内データ管理
- Remote Editing Protocolの実装と検証
- 連邦型Lindaによる分散アルゴリズムをデバッグするためのメタプロトコル
- Remote Editing Protocolの実装と検証
- 連邦型Lindaによる分散アルゴリズムをデバッグするためのメタプロトコル
- ソフトウェア開発における協調作業のためのアプリケーション間通信プロトコル(協調作業(2))
- リモートエディタのEclipseへの実装(並列・分散)
- Continuation based C言語によるOSシステムコールの意味記述(継続点)
- 線形時相論理によるContinuation based Cプログラムの検証(継続点)
- タブロー法を用いたContinuation based Cプログラムの検証(言語)
- Continuation based CによるPS3 Cellのシミュレーション(言語)
- ユーザーレベル通信ライブラリにおけるpacketベース通信API(カーネルとライブラリ)
- JAVAのソケットとJXTAを用いた大規模ネットワークゲームAgentSystemの比較と評価(性能評価)
- 大域IDを持たない連邦型タプルスペースFederated Linda(分散システム)
- 巡回トークンを用いた複数人テキスト編集とセッション管理(資源管理)
- Tree構造とMesh構造に対応した大規模ネットワークゲームAgent(アプリケーション環境)
- IPv4-IPv6ゲートウェイの改良
- WAN環境下における遠隔分散管理システムの提案
- IPv4-IPv6ゲートウェイの改良
- WAN環境下における遠隔分散管理システムの提案
- Remote Editing ProtocolのMac OSXのエディタへの応用
- エージェント機能を用いた分散Webキャッシングの有効性
- エージェント機能を用いた分散Webキャッシングの有効性
- ゲームフレームワークCerium TaskManagerの改良
- ゲームフレームワークCerium TaskManagerの改良
- Cassandraを使ったスケーラビリティのあるCMSの設計
- Cassandraを使ったスケーラビリティのあるCMSの設計
- スナップショットを用いたPC Cluster用デバッグツール(資源管理とデバッギングツール)
- Suciを用いた高レベル通信ライブラリ(並列・分散システム)
- Javaによるユーザレベルトランスポート層の実現と評価(ユビキタス時代のネットワーク技術)
- User Level Flow Control APIをもつ並列ライブラリの実装
- GameFrameWork CeriumにおけるSequentialなGame Programの分割と動作の検証
- 継続と決定的スケジューリングを用いたリアルタイム・システム
- Emacs上のリモートエディタ
- ユーザレベルUDPライブラリを使ったモバイル環境の設計
- Emacs上のリモートエディタ
- ユーザレベルUDPライブラリを使ったモバイル環境の設計
- リモートエディタのプロトコルとその有効性
- リモートエディタのプロトコルとその有効性
- マルチポイント・マルチサーバ・ニュースリーダの実装と評価
- マルチポイント・マルチサーバ・ニュースリーダの実装と評価
- 2階の論理によるプログラミング手法
- Cerium Task ManagerのGPGPUへの対応
- ディペンダブルシステムのための木構造を用いた合意形成データベースの提案と実装
- 分散フレームワークAliceのDataSegmentの更新に関する改良
- Cerium Task ManagerのGPGPUへの対応
- 分散フレームワークAliceのDataSegmentの更新に関する改良
- Continuation based CのLLVM/clang 3.5上の実装について
- OS授業向けマルチユーザVM環境の構築
- OS授業向けマルチユーザVM環境の構築
- Ceriumによる並列処理向けI/Oの実装
- 並列プログラミングフレームワークCeriumのOpenCL, CUDA対応
- Ceriumによる並列処理向けI/Oの実装
- 並列プログラミングフレームワークCeriumのOpenCL, CUDA対応