瞬時電源遮断機構を用いたマルチコアSoC向け省電力ソフトウェア実行環境(組込みシステム,一般)
スポンサーリンク
概要
- 論文の詳細を見る
8つのCPUコアを搭載するマルチコアSoC RP2と,自動並列化コンパイラOSCARを用いて,高い処理性能と省電力を両立するソフトウェア実行環境を構築した。この環境ではCPUコア数の増加に応じて処理速度を向上させるため,OSCARコンパイラと連携しデータの特性を考慮したメモリ配置を行うデータマッピング手法を開発し,各CPUコア上で実行される並列化タスク間のコミュニケーションオーバヘッド,すなわち,キャッシュコヒーレンシ維持とタスク間同期の時間を削減した。さらに,オンチップのCPUコアローカルメモリを活用した高速な電源遮断・復帰を実現する瞬時電源遮断機構を開発し,OSCARコンパイラとの連携によりプログラム実行中の待機CPUコアの電源を細粒度に遮断することで,無駄な電力消費を削減した。開発したソフトウェア実行環境上でセキュアAAC-LC圧縮処理を実行したところ,データマッピング手法を適用することにより,CPUコア数を1から8へと増やした場合に5.00倍の処理速度を達成した。さらに,瞬時電源遮断機構を併用することで,電力効率が10%向上することを確認した。
- 2010-01-14
著者
-
佐藤 真琴
株式会社日立製作所 システム開発研究所
-
木村 啓二
早稲田大学基幹理工学研究科情報理工学専攻
-
笠原 博徳
早稲田大学基幹理工学研究科情報理工学専攻
-
並木 美太郎
東京農工大学
-
間瀬 正啓
早稲田大学理工学術院基幹理工学部情報理工学科
-
佐藤 未来子
東京農工大学大学院工学府情報工学専攻
-
高田 雅士
(株)日立製作所中央研究所
-
佐藤 真琴
日立製作所システム開発研究所
-
白子 準
早稲田大学理工学部コンピュータ・ネットワーク工学科
-
水野 弘之
(株)日立製作所中央研究所
-
水野 弘之
株式会社日立製作所中央研究所
-
野尻 徹
日立製作所システム開発研究所
-
間瀬 正啓
早稲田大学基幹理工学部情報理工学科
-
伊藤 雅樹
株式会社日立製作所
-
伊藤 雅之
ルネサスエレクトロニクス株式会社
-
水野 弘之
日立製作所中央研究所
-
木村 啓二
早稲田大学基幹理工学部情報理工学科
-
佐藤 未来子
東京農工大学大学院工学府
-
小野内 雅文
日立製作所中央研究所
-
十山 圭介
日立製作所中央研究所
-
高田 雅士
ルネサステクノロジ
-
伊藤 雅之
ルネサステクノロジ
-
野尻 徹
株式会社日立製作所
-
十山 圭介
株式会社日立製作所中央研究所
-
笠原 博徳
早稲田大学
-
木村 啓二
早稲田大学
-
白子 準
早稲田大学理工学術院
-
小野内 雅文
(株)日立製作所中央研究所
-
間瀬 正啓
早稲田大学
-
野尻 徹
日立製作所 中央研究所
-
水野 弘之
日立製作所 中央研究所
-
白子 準
早稲田大学
-
十山 圭介
日立製作所 中央研究所
-
佐藤 真琴
日立製作所 システム開発研究所
-
佐藤 未来子
東京農工大学|独立行政法人科学技術振興機構CREST
-
佐藤 未来子
東京農工大学
関連論文
- 並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価(並列/分散アーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価(並列/分散アーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- 小面積・低消費電力を指向した動的再構成プロセッサFE-GA
- 瞬時電源遮断機構を用いたマルチコアSoC向け省電力ソフトウェア実行環境 (コンカレント工学)
- マルチコア上でのOSCAR APIを用いた低消費電力化手法(組込みシステムプラットフォーム)
- 54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討(マルチコア,プロセッサ,VLSI回路,デバイス技術(高速,低電圧,低消費電力))
- 54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討(マルチコア,プロセッサ, VLSI回路,デバイス技術(高速,低電圧,低消費電力))
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- OSCARチップマルチプロセッサ上でのマルチグレイン並列性評価(ARC-4 : 実行スケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- OSCARチップマルチプロセッサ上でのマルチグレイン並列処理
- 再構成プロセッサFE-GA上へのFFTのマッピング(アーキテクチャII, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- 再構成プロセッサFE-GAのオーディオ処理への応用(アーキテクチャII, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- 構成情報の階層記憶制御による再構成型プロセッサFE-GAの性能/面積比の向上(アーキテクチャII, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- ディジタルメディア向け再構成型プロセッサFE-GAの概要(アーキテクチャII, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- マルチコアプロセッサにおけるコンパイラ制御低消費電力化手法(プロセッサアーキテクチャ)
- ディジタルメディア向け動的再構成型プロセッサFE-GAへのDFGマッピングとその自動化手法(動的再構成システム,物理設計及び一般)
- シングルチップマルチプロセッサ上での近細粒度並列処理 (並列処理)
- シングルチップマルチプロセッサ上でのマルチグレイン並列処理
- マルチコアのためのコンパイラにおけるローカルメモリ管理手法(組込みシステムプラットフォーム)
- ヘテロジニアスマルチコア上でのコンパイラによる低消費電力制御(ARC-6 : ソフトウェア最適化,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ヘテロジニアスチップマルチプロセッサにおける粗粒度タスクスタティックスケジューリング手法(並列処理手法, SHINING 2006 「アーキテクチャとコンパイラの協調および一般」)
- ホモジニアスマルチコアにおけるコンパイラ制御低消費電力化手法(ARC-4: 低電力アーキテクチャ2, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法(ARC-6 : ソフトウェア最適化,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- マルチコアプロセッサ上でのマルチメディア処理の並列化(マルチプロセッサ)
- 独立に周波数制御可能な4320MIPS、SMP/AMP対応4プロセッサLSIの開発(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 独立に周波数制御可能な4320MIPS、SMP/AMP対応4プロセッサLSIの開発(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- マルチコア上でのマルチメディアアプリケーションの自動並列化(マルチコア)
- マルチコア上でのマルチメディアアプリケーションの自動並列化
- OSCARコンパイラにおける制約付きCプログラムの自動並列化(並列化コンパイラ)
- 階層グルーピング対応バリア同期機構の評価(マイクロアーキテクチャ,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- AT-2-2 動的再構成プロセッサFE-GAとその開発環境(AT-2.リコンフィギュラブルデバイスとCAD技術,パネルセッションチュートリアルセッション,ソサイエティ企画)
- 自動並列化のためのElement-Sensitiveポインタ解析
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- OSCAR API標準解釈系を用いたParallelizable Cプログラムの評価
- 情報家電用ヘテロジニアスマルチコアRP-Xにおけるコンパイラ低消費電力制御性能
- 組込み向けマルチコア上での複数アプリケーション動作時の自動並列化されたアプリケーションの処理性能
- マルチコア上でのOSCAR APIを用いた並列化コンパイラによる低消費電力化手法
- 近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの評価
- 2000-ARC-139-16 近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの構成
- 情報家電用マルチコア並列化APIを生成する自動並列化コンパイラによる並列化の評価
- 情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- プログラム構造に着目したメニーコアアーキテクチャシミュレータの高速化手法
- マルチコアのためのコンパイラにおけるローカルメモリ管理手法(組込みシステムプラットフォーム)
- マルチコア上でのOSCAR APIを用いた低消費電力化手法(組込みシステムプラットフォーム)
- マルチコアのためのコンパイラにおけるローカルメモリ管理手法(組込みシステムプラットフォーム)
- マルチコア上でのOSCAR APIを用いた低消費電力化手法(組込みシステムプラットフォーム)
- 手続き間自動並列化コンパイラWPPの評価
- 4. HPFトランスレータ"Parallel FORTRAN"の開発と評価 (>特集
- High Performance Fortranトランスレータの機能概要
- High Performance Fortranトランスレータの機能概要
- マルチグレイン並列処理用マルチプロセッサシステム
- SMPサーバ及び組込み用マルチコア上でのOSCARマルチグレイン自動並列化コンパイラの性能(並列化コンパイラ)
- 瞬時電源遮断機構を用いたマルチコアSoC向け省電力ソフトウェア実行環境(組込みシステム,一般)
- 情報家電用ヘテロジニアスマルチコアRP-Xにおけるコンパイラ低消費電力制御性能
- OSCAR API標準解釈系を用いた Parallelizable C プログラムの評価
- ヘテロジニアスマルチコアプロセッサ上でのスタティックスケジューリングを用いたMP3エンコーダの並列化
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク
- マルチコアにおけるParallelizable Cプログラムの自動並列化
- マルチコアプロセッサ上での粗粒度タスク並列処理のためのコンパイラによるローカルメモリ管理手法
- 共有メモリ型マルチプロセッササーバー上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価
- SMPマシン上での粗粒度タスク並列処理オーバーヘッドの解析
- キャッシュ最適化を考慮したマルチプロセッサシステム上での粗粒度タスクスタティックスケジューリング手法
- 並列化コンパイラにおける組合せ並列化技術
- 手続き間自動並列化コンパイラWPPの試作 : 実機性能評価
- マルチコア上でのマルチメディアアプリケーションの自動並列化(マルチコア)
- OSCARチップマルチプロセッサ上でのMPEG2エンコーディングの並列処理(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- マルチコアプロセッサ上でのデータローカライゼーション(一般セッションD 並列化と並列環境)
- チップマルチプロセッサ上でのMPEG2エンコードの並列処理(アーキテクチャとソフトウェアの協調技術)
- OSCARチップマルチプロセッサ上でのMPEG2エンコードの並列処理(チップマルチプロセッサ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- OSCARチップマルチプロセッサ上でのデータ転送ユニットを用いたデータローカライゼーション(ARC-7 : キャッシュシステム)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- データローカライゼーションを伴うMPEG2エンコーディングの並列処理(コンパイラ技術)
- HPF処理系における再分散解析機能の開発
- HPF処理系における再分散解析機能の開発
- ディジタルメディア向け動的再構成型プロセッサFE-GAへのFFTマッピングとその自動化手法(動的再構成プロセッサ設計,物理設計及び一般)
- 再構成型プロセッサFE-GAへのデータフローグラフマッピング手法(動的再構成プロセッサ設計,物理設計及び一般)
- HPF処理系における最適化機能 : 実行時判定の削除
- HPF処理系における最適化機能 : 実行時PE判定のブロック化
- 再構成型プロセッサFE-GAへのフィルタマッピングとその自動化手法(信号処理,LSI,及び一般)
- 再構成型プロセッサFE-GAへのフィルタマッピングとその自動化手法(信号処理,LSI,及び一般)
- 再構成型プロセッサFE-GAへのフィルタマッピングとその自動化手法(信号処理,LSI,及び一般)
- HPFにおけるデータ分散の図式表現と効果的計算分散法(並列処理ソフトウェア)
- 並列化チューニングツールAiviにおける手続き間データ依存位置検出機能の開発
- 手続き間データ依存位置検出機能
- データ分散の図式表現による多重ループの計算分散及び評価
- データ分散の図式表現と計算分散公式の提案及び評価