ヘテロジニアスマルチプロセッサのためのタスク分散手法(ARC-2:マルチコア1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
スポンサーリンク
概要
- 論文の詳細を見る
ヘテロジニアスマルチプロセッサは異種のコアの組み合わせにより構成されるプロセッサである.プログラムの並列性に着目し,個々の特徴に適した割り当てによって省スペース,低消費電力で高い計算性能を得ることができる.しかし,本来記述したい動作に加え,効率良く動作させるために考慮しなければならないことが多く,プログラミングが困難である.この解決のために,ヘテロジニアスマルチプロセッサ向けに容易にプログラムを記述することができるランタイムフレームワーク及び,これをバックエンドとする自動並列化手法について検討する.提案するランタイムフレームワークは,効率良く計算資源を利用するために,与えられたプログラムを粗粒度のタスクに分割し,静的あるいは動的にスケジューリングする.また,タスク単位でのプログラムの分割は,粗粒度自動並列化手法によるコード生成との親和性が高い.本稿では提案手法であるランタイムフレームワークと自動並列化手法について述べる.また,Cell B.E.を対象に提案するフレームワークを実装し,実行結果を評価した.提案手法に基づいて実行することで,静的なタスクと動的なタスクの協調により効率の良い並列実行を実現しプログラムの実行時間は93%になった.
- 2008-07-29
著者
-
三好 健文
東京工業大学大学院情報理工学研究科
-
三好 健文
東京大学大学院情報理工学系研究科創造情報学専攻
-
笹田 耕一
東京大学大学院情報理工学系研究科
-
笹田 耕一
東京大学:(現)東京大学大学院情報理工学系研究科創造情報学専攻
-
三好 健文
東京工業大学大学院情報理工学研究科|独立行政法人科学技術振興機構
-
笹田 耕一
東京大学大学院 情報理工学系研究科
関連論文
- スケーラブルFPGAシステムにおけるハードウェア拡張方式 (リコンフィギャラブルシステム)
- メニーコアプロセッサのためのネットワークトラフィックに着目したタスク配置問題の解析と考察(ネットワーク,クラウド及び一般)
- 小容量FPGAによるスケーラブルなシステム評価環境の構築手法(応用2)
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- WebVDIのためのVNC Proxy(OS-4:仮想化,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- カウンタ,合計値計算モジュール,7セグメントLEDの点灯制御,乱数生成器,シリアル通信モジュール VHDL/Verilog HDLの基本プログラム集 (特集 オリジナル・ハードウェアが作れる夢のデバイスFPGA ソフトウェア技術者のためのFPGA入門)
- シンプルで効率的なメニーコアアーキテクチャの開発(コンパイラ技術およびメニーコアアーキテクチャ)
- Smart Coreシステムによるメニーコアプロセッサの信頼性向上手法 (集積回路)
- SMTプロセッサにおけるスレッドスケジューラの開発(マルチスレッド)
- SMTプロセッサにおける再構成可能キャッシュモデルとFPGAによる実装
- FPGAを用いたSMTプロセッサの実現と再構成可能キャッシュメモリの検討(設計手法と高性能化, リコンフィギャラブルシステム, 一般)
- SMTプロセッサにおける同期方式の検討(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- SMTプロセッサにおける細粒度最適化手法の検討(ARC-3 : プロセッサアーキテクチャIII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- SMTプロセッサにおける物理レジスタバンクの動的割当て
- SMTプロセッサにおけるスレッドスケジューラの開発(スレッド・プロセス)
- マルチスレッドアーキテクチャ向けOS「Future」におけるプロセス管理
- マルチスレッドアーキテクチャにおけるスレッドライブラリの実装と評価(プロセッサアーキテクチャ)
- SMTプロセッサにおけるアウトオブオーダ実行に必要なリソースの共有方式の評価(ARC-1:プロセッサ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- スレッド管理機構を用いたオンチップマルチスレッドのためのキャッシュメモリシステム
- ヘテロジニアスマルチプロセッサのためのタスク分散手法(ARC-2:マルチコア1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 高速なRuby用仮想マシンの開発(研究会推薦博士論文速報)
- Feature-Packingのためのソフトウェアによるメモリ管理手法の実装と評価 (集積回路)
- マルチスレッドアーキテクチャOChiMuS PE向けシステムソフトウェアにおけるスレッド固有メモリの管理方式(システムプログラム)
- Rubyのメモリ管理の改善
- スケーラビリティとユーザビリティに優れた分散ファイルシステム向けのアクセス制御機構(データアクセス・移動体,インターネットセキュリティ,一般)
- Feature-Packingのためのソフトウェアによるメモリ管理手法の検討(Inventive and Creative Architecture特別セッションII)
- メニーコアプロセッサ時代を拓くシステムソフトウェアへの挑戦(セッション4:マルチコア向けシステムソフトウェア)
- Ricsin: Ruby に C を埋め込むシステム
- コンパイラとランタイムによるソフトウェアキャッシュの更新オーバヘッド隠蔽手法
- Mieruシステムソフトウェア
- CoreSymphonyアーキテクチャのための物理レジスタ管理手法
- KVMを利用した異種ホストOS間上でのライブマイグレーション
- RubyによるOS構成法の提案とその実行基盤の試作
- RubyによるOS構成法の提案とその実行基盤の試作
- Ruby用仮想マシンにおけるAOTコンパイラ
- SmartCoreシステムによるメニーコアプロセッサの信頼性向上手法
- SmartCoreシステムによるメニーコアプロセッサの信頼性向上手法
- Mieruシステムソフトウェア
- Ruby 処理系へのスナップショット GC の実装
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラビリティとユーザビリティに優れた分散ファイルシステム向けのアクセス制御機構(データアクセス・移動体,インターネットセキュリティ,一般)
- 2M-5 マルチコアシステムにおけるルータの実装と評価(ネットワークアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- SMTプロセッサ向けキャッシュメモリリプレース方式(プロセッサアーキテクチャ)
- マルチスレッドプロセッサにおける再構成可能キャッシュメモリ
- FPGAにおけるSMTプロセッサの実装モデル
- SMTプロセッサ向けの軽量な同期機構(プロセッサアーキテクチャ)
- Feature-Packingのためのソフトウェアによるメモリ管理手法の実装と評価
- Feature-Packingのためのソフトウェアによるメモリ管理手法の実装と評価
- メニーコアアーキテクチャ研究のためのスケーラブルなHW評価環境ScalableCoreシステム
- メニーコア向けタスクスケジューリングシステムの検討
- CoreSymphonyアーキテクチャの高効率化
- 軽量なプロセスマイグレーションを可能とするフレームワーク
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- A-3-3 バス接続バイパス構造を用いたマルチプロセッサのためのコードスケジューリング最適化手法についての検討(A-3.VLSI設計技術,一般講演)
- A-3-2 バイパス構造をバス接続したマルチプロセッサによる消費電力削減の検討(A-3.VLSI設計技術,一般講演)
- 3M-4 メニーコアプロセッサにおける効率的なキャッシュシステム(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- PCクラスタによる行動支援サービスプラットフォームZeoBroの初期実装と評価(ホームネットワーク,ユビキタスネットワーク,クラウドコンピューティング,コンテキストアウェア,位置情報サービス,eコマース及び一般)
- メニーコア時代に向けたインオーダ・アーキテクチャ再考(システムアーキテクチャ2,デザインガイア2010-VLSI設計の新しい大地-)
- 4M-7 メニーコアプロセッサ向けプロトタイピングシステムの高速化(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4M-6 メニーコアプロセッサにおける柔軟なタスク配置を実現する論理コア変換機構(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4M-3 メニーコアプロセッサの性能向上を目指すタスク配置手法(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4M-2 洗練されたメニーコアアーキテクチャの開発(チップマルチプロセッサ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-6 CMPの逐次性能向上を目指すCoreSymphonyアーキテクチャ(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-3 コア融合アーキテクチャのためのプログラムの振舞いに着目した融合コア数の制御(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- CoreSymphony アーキテクチャのための物理レジスタ管理手法
- CoreSymphony アーキテクチャの高効率化
- 1A-6 メニーコアプロセッサにおけるSmartCoreシステムを用いたReactive NUCAの実装の検討(計算機アーキテクチャ,一般セッション,アーキテクチャ,情報処理学会創立50周年記念)
- Feature-Packing のためのソフトウェアによるメモリ管理手法の実装と評価
- SmartCore システムによるメニーコアプロセッサの信頼性向上手法
- メニーコアアーキテクチャ研究のためのスケーラブルなHW評価環境 ScalableCore システム
- MICS:システム設計のためのフレキシビリティの高いシミュレーション環境
- レジスタスロットを考慮したSIMD向け細粒度自動並列化コンパイラ
- 細粒度自動並列化に基づくマルチプロセッサ向けの移植性の高いバックエンドの構成
- A-3-4 MICSを用いたシステムアーキテクチャ設計手法の検討と評価(A-3.VLSI設計技術,一般講演)
- A-3-1 低消費電力のための細粒度並列化におけるデータ転送回数の削減(A-3.VLSI設計技術,一般講演)
- A-3-16 柔軟なシステム設計のためのシミュレーション環境MICSの動作速度の評価(A-3.VLSI設計技術,一般講演)
- A-3-4 動的再構成可能プロセッサのためのコンテクスト自動抽出とプログラムの等価変換による改善の検討(A-3.VLSI設計技術,一般講演)
- A-3-2 確率モデルにもとづく細粒度自動並列化コンパイラの検討(A-3.VLSI設計技術,一般講演)
- 三次元表現空間を用いたプログラムの解析と並列化の一手法
- A-3-2 可変論理プロセッサへの演算器のマッピング問題について(A-3.VLSI設計技術,基礎・境界)
- データドリブンに基づくバス解析の一手法
- 間接アドレッシングDSPのための複数同時データ転送を考慮したメモリ配置手法
- スケーラブルFPGAシステムにおけるハードウェア拡張方式
- FPGAを用いたデータストリームに対するウィンドウジョインの検討(FPGAアクセラレーター,FPGA応用及び一般)
- FPGAを用いたデータストリームに対するウィンドウジョインの検討(FPGAアクセラレーター,FPGA応用及び一般)
- FPGAを用いたデータストリームに対するウィンドウジョインの検討(FPGAアクセラレーター,FPGA応用及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法
- ウィンドウ結合演算子のFPGAによる実現(スマートな社会を支えるインターネットアーキテクチャ論文)
- MPI埋め込み可能GPUプログラミングフレームワーク適用可能性の評価(並列処理支援,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- JavaRockを用いたHW/SW協調設計の検討 (リコンフィギャラブルシステム)
- プログラミング言語JavaのFPGA向け高位合成言語としての利用の検討(設計手法及び一般,デザインガイア2011-VLSI設計の新しい大地-)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法