メモリ消費電力に基づくCPU周波数の動的制御
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、メモリ消費電力に基づく動的な CPU 周波数制御手法について述べる。近年のプロセッサには DVFS と呼ばれる CPU 周波数および電圧を変更可能な仕組みが実装されている。CPU 使用率 100% の場合に DVFS を利用し省電力化する先行研究では、アプリケーションの性能が CPU 周波数に依存する CPU 依存型か CPU 周波数に依存しないメモリ依存型かを、パフォーマンスカウンタ (PMC) により判定し、メモリ依存型のアプリケーションの実行時に CPU 周波数を低く設定する。メモリ依存型では CPU 周波数を低く設定しても性能低下が小さいため、高性能と省電力が両立する。しかし、PMC は性能解析など様々な用途で利用されるため、CPU 周波数制御に PMC を利用すると、PM Cの用途が限定される問題がある。本稿では、CPU 依存型のアプリケーションの実行時にメモリ消費電力が小さく、メモリ依存型のアプリケーションの実行時にメモリ消費電力が大きいことを実験により明らかにし、メモリの消費電力に基づき CPU 周波数を制御する手法を提案する。提案手法の NPB による実機上での評価では、8 個中 6 個のベンチマークにおいて概ね目標通り性能の制御を行うことができた。また、5% の性能低下を許容する条件で CPU 周波数を制御した場合に、lu ベンチマークでは、3% の性能低下に対し、最大 9% 消費電力量を削減できた。本手法は、PMC を利用せず、センサーから取得するデータを利用しており、BIOS レベルの実現も可能である。
- 2011-07-20
著者
-
成瀬 彰
富士通研究所
-
中島 耕太
富士通研究所
-
中島 耕太
株式会社富士通研究所
-
中島 耕太
(株)富士通研究所
-
成瀬 彰
(株)富士通研究所
-
平井 聡
株式会社富士通研究所
-
平井 聡
(株)富士通研究所
-
三輪 真弘
早稲田大学大学院基幹理工学研究科
-
三輪 真弘
(株)富士通研究所
関連論文
- 正規化最尤符号化に基づくグラフクラスタリング (情報論的学習理論と機械学習)
- GPGPU上での流体アプリケーションの高速化手法 : 1GPUで姫野ベンチマーク60GFLOPS超(高性能計算とアクセラレータ)
- 大規模InfiniBandシステムにおける経路更新手法の提案(ネットワーク技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 並列プログラムの実行可搬性を実現するMPI通信ライブラリの設計(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- RDMA Storage I/O 向けカーネル通信 API の設計(ストレージ)
- 2.次世代高性能コンピュータシステム上の高信頼ソフトウェアシステムの開発支援技術(第1部:高い生産性を持つ高信頼ソフトウェア作成技術の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 無線分散ネットワークを用いた秘匿化機能の空間分散化によるプライベート無線ネットワークの情報漏洩リスク低減法 (ユビキタス・センサネットワーク)
- 無線分散ネットワークを用いた秘匿化機能の空間分散化によるプライベート無線ネットワークの情報漏洩リスク低減法 (アドホックネットワーク)
- 無線分散ネットワークを用いた秘匿化機能の空間分散化によるプライベート無線ネットワークの情報漏洩リスク低減法 (ソフトウェア無線)
- 無線分散ネットワークを用いた秘匿化機能の空間分散化によるプライベート無線ネットワークの情報漏洩リスク低減法 (無線通信システム)
- 時系列データの統計解析によるPCクラスタシステム解析手法の提案(クラスタシステム)
- キャッシュミス削減によるLinuxプロセススケジューラの高速化(アーキテクチャとシステムソフトウェア)
- NUMAマシンでのコマーシャルワークロード向けLinux最適化(並列処理)
- LinuxカーネルのNUMA向け最適化
- Xeonプロセッサ向けLinpackベンチマーク最適化手法とその評価(性能最適化)
- マルチホップ伝送を用いた復調可能領域の空間分散化による情報漏洩リスク低減法の提案(初めての研究会,初めての研究会,鉄道,車車間・路車間通信,リソース制御,スケジューリング,無線通信一般)
- PM/InfiniBand-FJ : InfiniBandを用いた大規模PCクラスタ向け高性能通信機構の設計(ネットワーク)
- メモリトレースを元にした大規模サーバの性能予測
- 2000-ARC-139-1 メモリバストレースを用いた共有バス型並列計算機のキャッシュ評価
- 4H-7 GATESによるCommercial Workloadアクセスパターンの分析
- 4H-6 GATES(PCサーバ用汎用メモリアクセストレースシステム)の開発
- ガウス混合分布の正規化最尤符号の効率的計算法とモデル選択 (情報論的学習理論と機械学習)
- 3A-2 強連結成分ベースのグラフ分割による分散並列LTLモデル検査の高速化(高性能計算,一般セッション,アーキテクチャ)
- B-5-121 復調可能領域の空間的分散化による情報漏洩リスク低減法における補助情報のマルチホップ伝送に関する一検討(B-5.無線通信システムB(ワイヤレスアクセス),一般セッション)
- 並列プログラムの実行可搬性を実現するMPI通信ライブラリの設計(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 10Gb Ethernet上のRDMA転送機能による仮想マシン移動の設計と評価(クラスタシステム)
- 10Gb Ethernet上のRDMAを用いた遠隔スワップメモリの実装(一般,SANを用いた高性能コンピュータシステム,及び一般)
- 10Gb Ethernet上のRDMA転送機能の仮想マシン移動への適用(一般,SANを用いた高性能コンピュータシステム,及び一般)
- 配列転置データ転送を高速化する10Gb Ethernetインタフェースカードの設計(ネットワーク)
- 高性能通信処理オフロードエンジンUZURA実現に向けて(HPC-6: 高速ネットワークとその応用)
- 10Gb Ethernetを用いた高性能通信機構の設計(HPC-6 : 通信ライブラリ)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- LinuxカーネルのNUMA向け最適化
- Fat-Tree構成InfiniBandネットワークにおける競合回避手法の提案
- InfiniBandにおける最適なアドレス割り当てによる経路更新処理の高速化
- LinuxカーネルのNUMA向け最適化
- 通信量を考慮したデッドロック回避ルーティング方式
- Fat-Tree構成InfiniBandネットワークにおける競合回避手法の提案
- マルチコアPCクラスタ向けAll-to-all通信アルゴリズムの提案と評価
- マルチコアPCクラスタ向けAll-to-allアルゴリズムの提案と評価
- マルチコアPCクラスタ向けAll-to-allアルゴリズムの提案と評価
- InfiniBandにおける最適なアドレス割り当てによる経路更新処理の高速化
- プロファイルを使用した並列LTLモデル検査のチューニング
- 多段スイッチInfiniBandネットワークにおける全対全通信性能の評価
- シームレスなMPI環境を実現するMPI-Adapterの設計と性能評価
- 多段スイッチ InfiniBand ネットワークにおける全対全通信性能の評価
- 4A-3 性能データの可視化分析ツール(設計・検証技術,一般セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4A-2 電力ベースサンプリングシステムPARITSの評価(設計・検証技術,一般セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 4A-1 電力ベースサンプリングシステムPARITSの提案(設計・検証技術,一般セッション,アーキテクチャ,情報処理学会創立50周年記念)
- マルチコアPCクラスタ向け All-to-all アルゴリズムの提案と評価
- マルチコアPCクラスタ向け All-to-all アルゴリズムの提案と評価
- メモリ消費電力に基づくCPU周波数の動的制御
- 高帯域と低遅延を両立するFat Tree結線方式の提案
- 通信量バランスの良いデッドロック回避ルーティング手法の提案とクラスタネットワークにおける評価 (コンピューティングシステム Vol.4 No.4)
- メモリ消費電力に基づくCPU周波数動的制御手法の評価