キャッシュ競合を制御する性能安定化機構内蔵型数値計算ライブラリについて(数値計算)
スポンサーリンク
概要
- 論文の詳細を見る
数値計算ライブラリ開発においてその品質を保証する指標として「性能」というきわめて重要な項目が存在する.近年,自動チューニングという手法で高性能を確保する方式が一般化しつつあるが,当該方式によって適切コードを選択するためには,異なるパラメータでのプログラムセグメントの性能上限を正確に評価するとともに,その性能をつねに再現できることが重要となる.本論文では,データレイアウトに起因するキャッシュ不安定性に対して一考察を与えるとともに,配列の再構成と動的な再配置によってn-way set associativeキャッシュの資源競合を回避する手法を提案した.本手法を用いることで,SR8000, Power4, Pentium4のいずれのハードウェアにおいても性能劣化を改善するとともに,実測性能の標準偏差を平均値の約2%以内に軽減することに成功した.
- 2004-05-15
著者
-
今村 俊幸
電気通信大学
-
直野 健
(株)日立製作所中央研究所
-
直野 健
株式会社日立製作所中央研究所
-
今村 俊幸
電気通信大学情報理工学部:crest (jst)
-
今村 俊幸
理化学研究所計算科学研究機構|crest(jst)
関連論文
- とびらの言葉
- 量子多体系・高精度シミュレーションの研究開発 : 密度行列繰り込み群法の超並列化と大規模計算
- LOBPCGにおける段階的収束とwindowの効果について(HPC-7:自動チューニングII,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- データセンター向け仮想ネットワーク構成情報収集機能の開発と評価 (情報通信マネジメント)
- 超並列環境向きの固有値計算アルゴリズムと自動チューニング (特集 数値計算のための自動チューニング)
- 業務モニタリングへ向けた映像ログからの人物適応動作解析(ライフログ,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 6.自動チューニング機能付き数値計算ライブラリ(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- 超並列環境向きの固有値計算アルゴリズムと自動チューニング(数値計算のための自動チューニング)
- マルチコア環境における固有値ソルバ
- 高速性と信頼性を両立するAC-IDR(s)法の提案と評価(HPC-3:自動チューニングI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 端末操作状況に連動した映像認識によるオフィス業務モニタリング(テーマセッション3(モニタリング関連),実世界センシングとその応用)
- 疎行列固有値ソルバーの自動チューニングLOBPCGの量子多体問題への応用を中心に(HPC-10 : 自動チューニングI)
- オープンスーパーコンピューター時代の数値計算ライブラリについて(インダストリアルマテリアル)
- 2.ソフトウェア自動チューニングの研究動向(概論,科学技術計算におけるソフトウェア自動チューニング)
- リスタート付ランチョス法における実行時パラメータ自動チューニング方式の提案(HPC-10 : 自動チューニングI)
- ブラウザモニタリングによる業務アプリ分析方法(第2セッション)
- 行列計算における自動チューニング研究動向について(HPC-11 : 自動チューニング)
- イベントログからPC操作への翻訳規則の自動生成方法(テーマセッション(1),データ工学とメディア理解との融合)
- 受注センタにおける業務解析事例(会場A)
- 数値計算ポリシー入力型グラムシュミット直交化ライブラリの異種混合計算機環境における性能評価(数値計算)
- 数値計算ポリシー入力型自動チューニング方式(HPC-2: 自動チューニング)
- 大規模疎行列固有値計算における行列ベクトル積の並列性能向上方法(行列・固有値問題における線形計算アルゴリズムとその応用)
- 数値計算ポリシーを入力とするベクトル群の直交化ライブラリ(数値計算)
- 【新刊書】, 奥田洋司・中島研吾共編, 並列有限要素解析[I], クラスタコンピューティング, 培風館, 2004年
- 業務モニタリング技術の提案
- 徒競走型の性能保証レベル向上方法の検討(HPC-5 : 科学技術計算)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 密度行列繰り込み群法における大規模固有値計算の並列化 (数値解析と数値計算アルゴリズムの最近の展開)
- データセンター向け仮想ネットワーク構成情報収集機能の開発と評価(管理機能,理論・運用方法論,及び一般)
- Segmented Scan法のCUDA向け最適化実装
- 業務実態把握システムを利用した業務効率向上意識付けコンサルティング方法の提案
- 業務実態把握システムを利用した業務効率向上意識付けコンサルティング方法の提案
- 業務実態把握システムによる残業縮減コンサルティング方法の提案
- 高速メッセージ基盤における低速端末対応方式の提案と評価
- 高速メッセージ基盤における低速端末対応方式の提案と評価
- OpenATLib:数値計算ライブラリ向け自動チューニングインタフェース
- 高速性と信頼性を両立させるAC-IDR(s) 法の提案と評価
- 業務実態把握システムを利用した業務効率向上意識付けコンサルティング方法の提案
- 高速メッセージ基盤における低速端末対応方式の提案と評価
- Xabclib : 汎用的自動チューニングインターフェースOpenATLibを利用した反復解法ライブラリの開発(数値計算のための自動チューニング(続))
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 反復解法IDR(s)法における偽収束問題と自動チューニング(数値計算のための自動チューニング(続))
- 行列計算ライブラリ向け数値計算ポリシーインターフェースの提案
- 自動チューニングインターフェースOpenATLibにおける疎行列ベクトル積アルゴリズム
- 業務実態把握システムによる残業縮減コンサルティング方法の提案
- 業務実態把握システムによる残業縮減コンサルティング方法の提案
- 業務実態把握システムによる残業縮減コンサルティング方法の提案
- OpenATLibを利用した疎行列ライブラリの開発と評価
- OpenATLib:汎用的な自動チューニングインターフェースの設計と実装
- Segmented Scan 法のCUDA向け最適化実装
- C-3-146 超並列計算機を用いたビーム拡大器集積化LDのFD-TD解析
- 22pZD-4 箱型トラップ中でのFFLO状態と強結合の効果(22pZD 量子エレクトロニクス(Fermi原子系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- マルチコアクラスタ向け通信手法を用いた密度行列繰り込み群法の並列化
- 非対称三重対角行列向けの並列連立一次方程式解法
- 単一メモリ型インターフェイスを有する自動チューニング並列ライブラリの構成方法
- 共有メモリ型並列計算機向けの高並列固有ベクトル解法とSR8000での評価
- 2000-HPC-82-6 非対称三重対角行列向けの並列連立一次方程式解法
- 分散メモリ型並列計算機向けスパース対称行列ソルバの開発と評価(並列処理)
- スパースソルバにおけるコピー削減方式
- SR8000向け固有値計算の高速化手法
- 分散メモリ型並列計算機向けスパースソルバの開発と評価
- オペレーショナルリスク計量のためのネットワーク監視方式
- 自動チューニングインターフェース OpenATLib における疎行列ベクトル積アルゴリズム
- 業務実態把握システムによる残業縮減コンサルティング方法の提案
- 業務実態把握システムによる残業縮減コンサルティング方法の提案
- とびらの言葉
- イベントログからPC操作への翻訳規則の自動生成方法(テーマセッション(1),データ工学とメディア理解との融合)
- キャッシュ競合を制御する性能安定化機構内蔵型数値計算ライブラリについて(数値計算)
- GRIDコンピューティング環境における行列ライブラリ向け性能保証方式の検討(数値計算)
- スーパーコンピュータ向けの行列計算ライブラリの研究開発
- 自動チューニング型の固有値ソルバーについて
- 非線形SDEの数値計算 : 小川の方法によるシミュレーションについて(確率数値解析に於ける諸問題,II)
- 共有メモリ型アーキテクチャでのC-Stabアルゴリズムの性能評価(HPC-2: 自動チューニング)
- SE行動分析表による管理業務の解析と評価
- 自動チューニングインターフェースOpenATLibにおける自動チューニング機能の評価
- 9.MPI通信ライブラリの自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- 量子多体問題における自由度の壁とそれを越える並列対角化アルゴリズムの開発 : 地球シミュレータ上での超並列量子計算の現状(数値シミュレーションを支える応用数理)
- MPI集団通信の性能チューニングについて
- 性能測定基盤と連携する数値計算ソフトウェア(HPC-11 : 自動チューニング)
- 地球シミュレータ上での18テラフロップス級及び1590億次元行列の厳密対角化計算:トラップされた強相関フェルミ原子ガスの基底状態探索(計算科学の基盤技術とその発展)
- 20507 地球シミュレータ・フルノードを利用した超大規模疎行列固有値の新規計算手法(大規模数値解析(2),OS11 大規模数値解析)
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 4011 地球シミュレータを用いた世界最大規模の固有値計算への挑戦(F-2 フォーラム「地球シミュレータにおける最適化およびハイエンドシミュレーション」)
- 強相関フェルミ原子ガスの量子物性 : 物性予測への新しいアプローチ
- 強相関電子系における超大規模固有値問題 : 地球シミュレータ上でのベクトル並列計算(数値シミュレーション)
- ハバードモデルの超大規模固有値問題に対する地球シミュレータでの並列計算法 (数値解析と新しい情報技術)
- 反復解法IDR(s)法における偽収束問題と自動チューニング
- 25aRD-10 光格子における擬CuO_2模型の提案(25aRD 量子エレクトロニクス(Fermi粒子系,及びBose-Fermi混合系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- 10万超コアを駆使する固有値ソルバについての検討
- ベクトル計算機上でのRetry型アルゴリズム群について(数値計算)
- ベクトル計算機上での Retry 型アルゴリズム群について
- 性能安定型LAPACKの自動生成の試み(HPC-4 : 数値計算アルゴリズム(1))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- ParCo2009参加報告(学術会合報告)
- 自動チューニングによる通信最適化を施した固有値ソルバの開発について
- SaaS提供システムを監視するための基本データ形式の定義 (情報通信マネジメント)
- 収束障害(Fault Convergence):数値計算ソフトウェアにおける新しい安全性の概念
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- PC操作支援エージェントによるアプリケーションの操作性改善