共有メモリ型並列計算機におけるLAPACKの性能評価
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,代表的な共有メモリ型並列計算機であるHITACHI SR80001ノード,SGI Origin2000上において,連立一次方程式直接解法および固有値問題を例に,標準的なアルゴリズムに基づく特別なチューニングを施さずに,コンパイラの自動並列化機能のみで並列化したプログラムと,ベンダによってチューニングされたLAPACK/BLASを用いたプログラムの性能を比較し,ベンダ提供のLAPACKの性能評価を行う.その結果に基づき,連立一次方程式直接解法についてはブロック化アルゴリズムの適用およびLevel3BLASのチューニングにより,LAPACKの高性能化が図られていることを示す.また対称固有値問題については高速アルゴリズムの利用により高性能化が図られていることを示す.一方,非対称固有値問題については既存のアルゴリズムでは共有メモリ型並列計算機の性能は十分に引き出せないことを示す.
- 社団法人情報処理学会の論文
- 2002-09-15
著者
-
長谷川 秀彦
図.情.大学
-
長谷川 秀彦
筑波大学図書館
-
長谷川 秀彦
筑波大学図書館情報メディア研究科
-
長谷川 秀彦
筑波大学
-
舘野 諭司
東京コンピュータサービス株式会社
-
桧山 澄子
埼玉大学理学部数学科
-
西村 成司
日本SGI株式会社
-
舘野 諭司
埼玉大学大学院理工学研究科情報システム工学専攻
-
重原 孝臣
埼玉大学大学院理工学研究科情報システム工学専攻
-
長谷川 秀彦
図書館情報大学
-
重原 孝臣
埼玉大学大学院理工学研究科
-
舘野 諭司
埼玉大学
関連論文
- SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
- WebCT教材の作成を通じた大学生のグループ学習 (教育実践を指向した学習支援システム/一般)
- 128.跳躍選手のスポーツ障害第1報 : 大学生と高校生の比較 : 運動生理学的研究II
- A-028 自己拡張可能な構文解析器生成系における構文解析手法の選択機能の実現(A分野:モデル・アルゴリズム・プログラミング)
- 演算精度をかえれば見えてくる線形方程式の世界
- 高速な4倍精度演算を用いたクリロフ部分空間法の安定化
- ソフトウェア
- 行列計算ライブラリインタフェースSILCの分散並列環境への実装(HPC-14 : 分散環境(2))
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 共有メモリ型並列計算機上の行列計算に対する並列化手法の性能評価(並列処理アルゴリズムと評価)
- 共有メモリ型並列計算機におけるLAPACKの性能評価
- 共有メモリ型並列計算機向け線形演算ライブラリにおける並列化手法の評価
- SOR法を用いた可変的前処理付き一般化共役残差法
- GCR法に対する可変的前処理法の性能評価 (偏微分方程式の数値解法とその周辺II)
- テネシー大学計算機科学科
- C-2. 研究におけるコンピュータの利用環境の向上
- テネシー大学におけるHigh Performance Computing
- テネシー大学計算機科学科(CS. UTK. EDU)紹介(海外情報)
- 第4巻第2号発行にあたって
- ベクトル計算機におけるFill-in付き(M)ICCG法の性能評価
- 連立一次方程式の標準解法
- 対称正定値疎行列の条件数概算法
- 移流拡散方程式に対するBCG法系統の解法の収束特性について
- 帯行列に対する直接解法の高速化
- ベクトル計算機と汎用計算機のための対称帯行列固有値解法
- 連立一次方程式の直接解法とスーパーコンピュータ(スーパーコンピュータのための数値計算アルゴリズムの研究)
- 対称帯行列のスツルム・逆反復法について(スーパーコンピュータのための数値計算アルゴリズムの研究)
- 学生から見たオンライン目録システム
- 学生から見たオンライン目録システムの評価 : 第13回ドクメンテーション・シンポジウム概要
- オンライン目録システムの要件--利用者にとって何が重要か
- 実対称固有値問題に対する多分割の分割統治法の分散並列アルゴリズムの提案
- 実対称三重対角固有値問題に対する多分割の分割統治法の改良(理論,行列・固有値問題の解法とその応用,平成18年研究部会連合発表会)
- 実対称三重対角固有値問題の分割統治法の拡張(行列・固有値問題における線形計算アルゴリズムとその応用)
- 反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化
- OpenMPを用いた帯行列に対する直接解法の並列化(数値計算)
- 非対称行列から生成された対称行列に対するCG法 (数値解析と新しい情報技術)
- 2P2-3F-B6 人とロボットの歩行同期のための視覚による踵追跡・歩行ピッチ抽出
- 対称正定値疎行列に対するPCG法のプログラム-1-2次元問題
- 対称正定値行列を係数とする連立1次方程式の解法の比較
- 対称正定値疎行列Aと不完全コレスキ-分解UTUの固有値分布
- 複数人物の発見・追跡のための機能分割・画像分割双方を用いた処理高速化(人間機械協調2)
- A-10-4 方向選択的音声送出のためのスピーカアレイシステムの構築
- 2A1-K09 複数移動対象同時追跡のための視野中動き成分の検出と分離
- 2A1-K02 スピーカアレイによる対人追従方向可変音響ビーム形成の実現技法 : 汎用 PC ソフトウェアによる 45μsec 等周期 16CH 同時サンプリング DA 変換の達成
- 2A1-K8 人間共存型ロボットのための対人インタラクション : 顔を見て寄ってくる動作の実現(71. 行動メディア・コミュニケーション)
- 擬モーメント特徴量を用いたアクティブカメラの回転推定
- 向きに依存しない顔画像認識のための向きに依存した複数の識別器の統合
- D-12-1 概形入力による画像検索のための多重解像度自己回帰モデル
- 1A1-77-111 頑健な顔発見手法を用いた実時間顔認識システム
- 2A1-67-089 高速性, 汎用性, 拡張容易性を兼ね備えた並列視覚処理システム
- 1P1-77-122 行動認識のための相関演算の並列化・高速化
- 1P1-77-121 対人相互作用研究用移動ロボットのための音声対話インタフェースの実現
- 1A1-77-109 対人相互作用研究用移動ロボットの構築
- 1A1-77-108 移動対象追跡可能な選択的収音システム : マイクアレイによる音響焦点形成
- ネットワーク利用に関する学内罰則規定のあり方
- 研究開発環境におけるネットワーク不正アクセス防御法
- 密行列に対する共役勾配法系算法の並列化
- 複雑ネットワークから得られる時系列の周期性とランダム性に対する理論的解析
- 鐸木能光著, デジタルストレス, 地人書館, 2001年, pp.254