HPC Challengeベンチマークを用いたSX-7システムの性能評価(HPCハードウェア)
スポンサーリンク
概要
- 論文の詳細を見る
HPC Challenge(以下HPCCとする)ベンチマークは, 高性能計算(High-Performance Computing, 以下HPC)システムの総合的な性能評価のために提唱されているベンチマーク集である.現在までに広く用いられている浮動小数点演算性能に加えて, メモリアクセスやネットワーク通信の性能等, 複数の観点から多角的にHPCシステムを評価することにより, HPCCベンチマークは実用的な科学技術計算に対する実効性能を適切に評価する指標として期待されている.本論文では, 東北大学情報シナジーセンターで運用しているNEC SX-7システムの性能をHPCCベンチマークを用いて評価した結果について述べる.28の評価項目のうち16項目において著しく高い評価が得られた結果に基づいて, HPC分野におけるベクトル型アーキテクチャの優位性について議論する.
- 社団法人情報処理学会の論文
- 2005-08-15
著者
-
滝沢 寛之
東北大学
-
滝沢 寛之
東北大学大学院情報科学研究科
-
小林 広明
東北大学サイバーサイエンスセンター
-
小林 広明
東北大学情報シナジー機構
-
小林 広明
東北大学情報シナジーセンター
-
小久保 達信
日本電気株式会社
-
片海 健亮
NECソフト株式会社
-
小林 広明
東北大学サイバーサイエンスセンター|科学技術振興機構戦略的創造研究推進事業
-
滝沢 寛之
東北大学大学院 情報科学研究科
関連論文
- 広域ベクトルコンピュータ連携による次世代HPC基盤の構築(3.2 第8回情報シナジー研究会, 3. 研究活動報告)
- 10.GPUコンピューティングにおけるソフトウェア自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- GPUを効率的に利用するための言語拡張と自動最適化手法(HPC-12:言語処理系,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- GPUコンピューティングのためのストリーム処理記述言語
- ニューラルネットワーク(クロストークリンク付きBPD)のFSK復調への応用
- 大規模計算環境における分散協調型負荷分散手法(分散システム構築運用技術,新しいパラダイムの中での分散システム/インターネット運用・管理)
- パイプライン型アーキテクチャにおけるOR並列型Prolog実行の一検討
- RC-006 ウェイアロケーション型共有キャッシュ機構のハードウェア設計に関する研究(ハードウェア・アーキテクチャ,査読付き論文)
- I-004 フォトンマップ分割に基づく並列画像生成アルゴリズム(I分野:グラフィクス・画像)
- LC-010 SMTプロセッサの実行時性能予測のためのハードウェアリソース競合解析(ハードウェア・アーキテクチャ)
- LC-006 消費電力を考慮したウェイアロケーション型共有キャッシュ機構(ハードウェア・アーキテクチャ)
- ウェイアロケーション型共有キャッシュ機構の性能評価(ARC-2 : キャッシュメモリ,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 実行時性能予測に基づくCPUとGPUへの動的タスク割当の検討(ハードウェア・アクセラレータ)
- LL_007 P2P型資源検索システムにおける動的論理リンク管理機構(L分野:ネットワークコンピューティング)
- LC_006 スレッド特微量に基づくマルチコアプロセッサスケジューリング(C分野:ハードウェア)
- LA-006 大規模P2Pシステムにおける計算資源探索のモデル化と性能評価(A分野:モデル・アルゴリズム・プログラミング)
- HPC Challengeベンチマークを用いたSX-7システムの性能評価(HPCハードウェア)
- ベクトル量子化用コードブック生成のための並列弱肉強食アルゴリズムの性能解析
- LJ-11 視覚的画質劣化を抑制するベクトル量子化手法(J. グラフィクス・画像)
- ベクトル量子化のためのコードブック生成並列処理に関する研究
- ベクトル量子化のための並列コードブック生成アルゴリズムの性能評価(2.第1回情報シナジー研究会)
- 多層パーセプトロンの分類能力向上法に関する一検討
- ニューラルネットワークを利用した自動表情認識システム
- A-19-4 音声による計算機利用支援のための文字情報識別に関する一考察
- 3DCGiRAMアーキテクチャによる実時間レイトレーシングシステム
- MULHIキャッシュの設計及び評価
- D-11-73 レイトレーシングハードウェアのための交差判定器の計算精度に関する一考察
- VLIWアーキテクチャのためのダイナミックブースティング機構
- 投機的実行を行なうVLIWプロセッサの命令供給機構の設計
- 2ZC-7 参照画像を用いた光線追跡法の高速化に関する一検討(レンダリングとアニメーション,一般講演,インタフェース)
- 2ZC-5 大域照明モデルに基づいたガス状物体の表現手法に関する一検討(レンダリングとアニメーション,一般講演,インタフェース)
- 3M-1 興味部位の形状を考慮した動的輪郭モデル
- MULHIキャッシュ : VLIWプロセッサのための命令キャッシュ機構 (並列処理)
- 再構成可能な同期式データフロー計算機に関する一検討
- データ並列ボリュームレンダリングのためのボリューム適応分割手法
- ベクトル命令とスカラ命令を融合した命令レベル並列処理のためのスケジューリング手法
- An Object-Space Parallel Multi-pass Rendering Algorithm
- 東北大学サイバーサイエンスセンターの取り組みとSX-9の性能評価 (スーパーコンピュータSX-9特集)
- 複数文字認識エンジンの統合のための重み付き投票法(一般セッション, 音声による環境認識(チュートリアル講演))
- アクティブカメラを用いた環境中の文字の効率的探索法
- シーン中の文字領域検出における周波数特徴の分析と比較(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- 大規模科学計算システムの構築と運用(2.第1回情報シナジー研究会)
- 再構成可能な同期式データフロー計算機に関する一検討
- 再構成可能な同期式データフロー計算機に関する一検討
- TLB統一型キャッシュのためのタイムスタンプ無効化方式とその性能評価
- RICEによる2次キャッシュメモリの性能評価
- SPMDモデルによる関数型プログラム実行の一検討
- TLB-Assisted Cache
- ウェーブパイプラインを用いた時分割擬似マルチポートレジスタファイル (非同期式回路/システム設計論文小特集)
- 分散フレームバッファシステムを持つ画像生成用超並列処理システム(Mπ)^2の性能評価
- ハードウェアキャッシュ評価システム "RICE"
- 並列グラフ簡約システムにおけるタスク割当て手法とメモリ参照局所性評価
- ジェットパイプラインの並列化命令スケジューリングに関する一検討
- 分散共有メモリ型並列計算機のためのメッセージ損失を許容するメモリアクセスプロトコル
- データの更新をバイト単位で管理するキャッシュメモリ
- プロセッサクラスタ用メモリアクセスバッファリング機構
- メッセージロスのあるネットワークを用いた分散共有メモリマルチプロセッサシステムの評価
- FL階層化並列簡約システムの共有メモリシステム
- Wave-Pipeliningを用いた時分割擬似マルチポートレジスタファイル
- ジェットパイプラインのためのコンパイル技術に関する一検討
- FL階層化並列簡約システムの性能評価
- OpenCLによるGPUコンピューティングの性能評価
- CUDAアプリケーション向けチェックポイント・リスタート機能の実装と評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- CUDAアプリケーシヨン向けチェックポイント・リスタート機能の実装と評価
- キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
- キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
- OpenCL によるGPUコンピューティングの性能評価
- ワーキングセット評価に基づくスレッドスケジューリング
- ワーキングセット評価に基づくスレッドスケジューリング
- F0103(4) Cellによる高性能計算の可能性を探る([F0103]計算力学の新たな潮流-GPGPU,FPGA,CELLコンピューティング-,先端技術フォーラム)
- C-023 プロセッサ自動選択機能を有するBLASの実現に向けた性能評価(ハードウェア・アーキテクチャ,一般論文)
- RC-008 ボランティアコンピューティングの高効率化ためのクライアントレベルスケジューリング(ハードウェア・アーキテクチャ,査読付き論文)
- SPRAT:実行時自動チューニング機能を備えるストリーム処理記述用言語
- 動的負荷分散機能を持つ高性能ボランティアコンピューティングの実現
- プログラム自動生成技術に基づくGPUコンピューティングの性能評価
- 3次元積層型乗算器の回路分割手法に関する研究(学生・若手研究会)
- 624 消費エネルギを考慮したGPUコンピューティングの検討(OS3.GPGPUコンピューティング(3),オーガナイズドセッション)
- Prolog言語の階層処理システムとその評価
- メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構(ネットワーク応用,インターネット技術とその応用論文)
- 統合開発環境と連携するポータブルなビルドシステム
- HPCアプリケーションの性能可搬性に関する一検討
- ナノ粒子群形成アプリケーションのOpenACCによる実装と性能評価
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究(高速デジタルLSI回路技術,デザインガイア2011-VLSI設計の新しい大地-)
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究(高速デジタルLSI回路技術,デザインガイア2011-VLSI設計の新しい大地-)
- 大規模並列システムのノード間通信を考慮した性能モデルに関する一検討
- 履歴情報に基づくジョブスケジューリングによる広域ベクトルコンピュータ連携の実現
- 大規模並列システムのノード間通信を考慮した性能モデルに関する一検討
- メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究
- チューニング対象の限定による効率の良い性能可搬性向上手法
- ブロックバイパス機構によるキャッシュのエネルギ効率化に関する研究
- マルチプラットフォームにおける最適化手法の効果に関する一検討
- ソフトウェア進化のための自動性能追跡システム
- 履歴情報に基づくジョブスケジューリングによる広域ベクトルコンピュータ連携の実現(ネットワーク研究開発テストベッド運用・利用,一般)
- 10.6 複合システムにおけるチェックポイントリスタート(第10章:将来の課題,ディペンダブルVLSIシステム)