メニコアアクセラレータ搭載サーバにおけるマルチタスク環境でのスループット向上手法(FPGA・メニーコア,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
スポンサーリンク
概要
- 論文の詳細を見る
多数のエンドユーザ向けクラウドサービスは高いスループット性能が求められるが,HPC分野やWebサーバ向けの従来のスループット向上手法では,アプリケーションの特徴が異なるために演算器リソースを効率良く使い切れない課題がある.一方,チップベンダが発表しているメニコアアクセラレータの傾向から,メニコアアクセラレータはベクトル演算のようなソフトウェアスレッド内並列性とソフトウェアスレッド並列性を活用しなければならないアーキテクチャになると予想される.本稿では,今後のメニコアアクセラレータ搭載サーバにおいて,対象アプリケーションの構造的特徴から複数の実行方式を用意し,多入力を実行方式ごとに分けて実行することでホストCPUとメニコアアクセラレータの演算器リソースを効果的に使い切る手法を提案する.メニコアアクセラレータ搭載サーバ上で実行される対象アプリケーションに提案手法を適用することで,従来手法に対して20%以上の性能向上試算が得られ,対象とする問題領域において特に本手法の有効性が確認できた.
- 一般社団法人電子情報通信学会の論文
- 2012-07-26
著者
-
宮本 孝道
早稲田大学理工学部コンピュータ・ネットワーク工学科
-
石坂 一久
早稲田大学理工学部コンピュータ・ネットワーク工学科
-
酒井 淳嗣
日本電気株式会社
-
石坂 一久
早稲田大学
-
石坂 一久
日本電気株式会社
-
酒井 淳嗣
NEC,システムIPコア研究所
-
宮本 孝道
早稲田大学基幹理工学部情報理工学科
-
酒井 淳嗣
Nec システムipコア研究所
-
細見 岳生
日本電気株式会社グリーンプラットフォーム研究所
-
宮本 孝道
日本電気株式会社グリーンプラットフォーム研究所
関連論文
- 汎用マルチコアプロセッサ向け一般学習ベクトル量子化の効率的並列学習手法(研究速報)
- ユーザ利用状況に応じたアプリ性能制御のためのリソース配分方法(コミュニケーション支援(3),HCGシンポジウム)
- D-6-25 アプリ性能制御のためのリソース配分方法(D-6. コンピュータシステムC(ソフトウェア),一般セッション)
- 自動並列化技術を用いたメディア処理オフロード (ディペンダブルコンピューティング)
- 自動並列化技術を用いたメディア処理オフロード (コンピュータシステム)
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理 (集積回路)
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- OSCARチップマルチプロセッサ上でのマルチグレイン並列性評価(ARC-4 : 実行スケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- マルチグレイン並列性向上のための選択的インライン展開手法(並列・分散処理技術)
- マルチグレイン並列性向上のためのインライン展開手法
- 並列処理階層自動決定手法を用いた粗粒度タスク並列処理
- マルチコアプロセッサ上でのマルチメディア処理の並列化(マルチプロセッサ)
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- マルチコア上でのマルチメディアアプリケーションの自動並列化(マルチコア)
- マルチコア上でのマルチメディアアプリケーションの自動並列化
- OSCARコンパイラにおける制約付きCプログラムの自動並列化(並列化コンパイラ)
- 組込み向けマルチコアプロセッサMPCoreを用いた応答性/機能性両立環境評価 : 制御処理と情報処理の融合にむけて(マルチコア・マルチプロセッサ,組込技術とネットワークに関するワークショップETNET2008)
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- 組込み向けマルチコア上での複数アプリケーション動作時の自動並列化されたアプリケーションの処理性能
- 情報家電用マルチコア並列化APIを生成する自動並列化コンパイラによる並列化の評価
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- SMPサーバ及び組込み用マルチコア上でのOSCARマルチグレイン自動並列化コンパイラの性能(並列化コンパイラ)
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 共有メモリ型マルチプロセッササーバー上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価
- 配列間パディングを用いた粗粒度タスク並列処理のためのキャッシュ最適化(並列・分散処理技術)
- スタティックスケジューリングを用いたデータローカライゼーションにおける配列間パディング(コンパイラとスレッド技術)
- マルチグレイン並列処理のための階層的並列性制御手法
- ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化
- SMPシステム上でのOSCARマルチグレイン並列化コンパイラの性能
- 共有メモリマルチプロセッサ上でのキャッシュ最適化を考慮した粗粒度タスク並列処理(並列処理)
- 共有メモリマルチプロセッサ上でのデータローカライゼーション対象マクロタスク決定手法
- 粗粒度並列性抽出のための解析時インライニングとフレキシブルクローニング
- 共有メモリマルチプロセッサ上でのデータローカライゼーション対象マクロタスク決定手法
- 粗粒度並列性抽出のための解析時インライニングとフレキシブルクローニング
- 商用SMP上での粗粒度タスク並列処理
- キャッシュ最適化を考慮したマルチプロセッサシステム上での粗粒度タスクスタティックスケジューリング手法
- 共有メモリマルチプロセッサシステム上での粗粒度タスク並列処理
- 共有メモリマルチプロセッサシステム上での粗粒度タスク並列実現手法の評価
- B-15-6 動的キャッシュ分割を用いたアプリケーション制御(B-15.モバイルマルチメディア通信,一般セッション)
- マルチコア上でのマルチメディアアプリケーションの自動並列化(マルチコア)
- マルチコアプロセッサ上でのデータローカライゼーション(一般セッションD 並列化と並列環境)
- OSCARチップマルチプロセッサ上でのデータ転送ユニットを用いたデータローカライゼーション(ARC-7 : キャッシュシステム)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 自動並列化技術を用いたメディア処理オフロード
- 4. 組み込みマルチコアプロセッサのソフトウェアプラットフォーム(マルチコアにおけるソフトウェア)
- 家電連携を目指したマルチプロセッサ活用による安全なモバイルプラットフォーム(MoMuC特別セッション「モバイルとホームネットワーク連携」, 移動通信ワークショップ)
- 家電連携を目指したマルチプロセッサ活用による安全なモバイルプラットフォーム(MoMuC特別セッション「モバイルとホームネットワーク連携」, 移動通信ワークショップ)
- 家電連携を目指したマルチプロセッサ活用による安全なモバイルプラットフォーム(モバイルとホームネットワーク連携, 移動通信ワークショップ)
- 家電連携を目指したマルチプロセッサ活用による安全なモバイルプラットフォーム(MoMuC 特別セッション「モバイルとホームネットワーク連携」, 移動通信ワークショップ)
- 家電連携を目指したマルチプロセッサ活用による安全なモバイルプラットフォーム(MoMuC特別セッション「モバイルとホームネットワーク連携」, 移動通信ワークショップ)
- 家電連携を目指したマルチプロセッサ活用による安全なモバイルプラットフォーム
- SMPマシン上での粗粒度タスク並列処理におけるデータプリフェッチ手法(SMPシステム)(デザインガイア2003 : VLSI設計の新しい大地を考える研究会)
- SMPマシン上での粗粒度タスク並外処理におけるデータプリフェッチ手法
- マルチコアSoCの高度な観測を可能とするプログラマブルなデバッグ支援ハードウェアの開発(SoC・解析,組込技術とネットワークに関するワークショップETNET2008)
- マルチコアSoCの高度な観測を可能とするプログラマブルなデバッグ支援ハードウェアの開発(SoC・解析,組込技術とネットワークに関するワークショップETNET2008)
- マルチコアSoCの高度な観測を可能とするプログラマブルなデバッグ支援ハードウェアの開発(SoC・解析,組込技術とネットワークに関するワークショップETNET2008)
- マルチコアSoCの高度な観測を可能とするプログラマブルなデバッグ支援ハードウェアの開発(SoC・解析,組込技術とネットワークに関するワークショップETNET2008)
- 高信頼かつ高機能を実現する組込み向けOS共存システム (組込みソフトウエア・ソリユーシヨン特集) -- (組込みシステム・プラットフォーム)
- 共有メモリ型マルチプロセッササーバー上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価
- 組込み向けマルチコアプロセッサMPCoreを用いた応答性/機能性両立環境評価 : 制御処理と情報処理の融合にむけて(マルチコア・マルチプロセッサ,組込技術とネットワークに関するワークショップETNET2008)
- 組込み向けマルチコアプロセッサMPCoreを用いた応答性/機能性両立環境評価 : 制御処理と情報処理の融合にむけて(マルチコア・マルチプロセッサ,組込技術とネットワークに関するワークショップETNET2008)
- 組込み向けマルチコアプロセッサMPCoreを用いた応答性/機能性両立環境評価 : 制御処理と情報処理の融合にむけて(マルチコア・マルチプロセッサ,組込技術とネットワークに関するワークショップETNET2008)
- 共有メモリ型マルチプロセッササーバー上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価(コンパイラ及びツール, SHINING 2005「アーキテクチャとコンパイラの協調および一般」)
- OSCARマルチコア上でのローカルメモリ管理手法(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- B-6-45 GPGPUとマルチコアCPUを用いた大規模経路計算の高速化(B-6.ネットワークシステム,一般セッション)
- 低消費電力マルチコアRP2上での複数メディアアプリケーション実行時の消費電力評価
- D-6-9 アクセラレータの使用時間を考慮したヘテロメニコアマルチスレッドプロセッサ向けスケジューリング方式(D-6.コンピュータシステムC(ソフトウェア),一般セッション)
- D-6-8 階層型ヘテロメニコア向けコア割り当て方法(D-6.コンピュータシステムC(ソフトウェア),一般セッション)
- 2000-ARC-139-32 OpenMPを用いた粗粒度並列処理
- メニコアアクセラレータ搭載サーバにおけるマルチタスク環境でのスループット向上手法(FPGA・メニーコア,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
- メニコアアクセラレータ搭載サーバにおけるマルチタスク環境でのスループット向上手法