SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
スポンサーリンク
概要
- 論文の詳細を見る
CG法などのクリロフ部分空間法の収束性は丸め誤差に大きく影響される.収束の改善を図るには高精度演算が有効であるが演算量が大きくなる.われわれは開発中の反復解法ライブラリLisに4倍精度演算を実装しIntel SSE2命令を用いて高速化を行った.Lisの倍精度と同じインタフェースで4倍精度演算が利用できるよう行列A,右辺bは倍精度のままで反復解法中のベクトルのみを4倍精度とした.その結果FORTRANの4倍精度より約4.3倍速く,倍精度の計算時間の約4.5倍程度で抑えることができた.
- 2006-10-05
著者
-
西田 晃
九州大学情報基盤研究開発センター
-
藤井 昭宏
工学院大学
-
西田 晃
中央大学:東京大学:科学技術振興機構
-
長谷川 秀彦
図.情.大学
-
長谷川 秀彦
筑波大学図書館情報メディア研究科
-
長谷川 秀彦
筑波大学
-
小武守 恒
科学技術振興機構
-
長谷川 秀彦
筑波大学 図書館情報メディア研究科
-
西田 晃
中央大学 21世紀COEプログラム
-
藤井 昭宏
工学院大学情報学部
関連論文
- エアリード楽器の発音機構 : 流体と音の相互作用の解析 (オイラー方程式の数理 : 渦運動と音波150年)
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 21aEJ-5 圧縮性LESを用いた小型エアリード楽器の数値解析(21aEJ 圧縮性流体,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
- WebCT教材の作成を通じた大学生のグループ学習 (教育実践を指向した学習支援システム/一般)
- 21aEJ-3 3次元LESによるオカリナの発音機構の解明(21aEJ 圧縮性流体,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 28pQC-6 圧縮性LESを用いた小型エアリード楽器の数値解析(渦運動・波動・その他,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- 128.跳躍選手のスポーツ障害第1報 : 大学生と高校生の比較 : 運動生理学的研究II
- A-028 自己拡張可能な構文解析器生成系における構文解析手法の選択機能の実現(A分野:モデル・アルゴリズム・プログラミング)
- 圧縮性LESを用いたエアリード楽器の発音機構の数値解析 (数値解析と数値計算アルゴリズムの最近の展開--RIMS研究集会報告集)
- 演算精度をかえれば見えてくる線形方程式の世界
- 高速な4倍精度演算を用いたクリロフ部分空間法の安定化
- ソフトウェア
- 行列計算ライブラリインタフェースSILCの分散並列環境への実装(HPC-14 : 分散環境(2))
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 共有メモリ型並列計算機上の行列計算に対する並列化手法の性能評価(並列処理アルゴリズムと評価)
- 共有メモリ型並列計算機におけるLAPACKの性能評価
- 共有メモリ型並列計算機向け線形演算ライブラリにおける並列化手法の評価
- SOR法を用いた可変的前処理付き一般化共役残差法
- GCR法に対する可変的前処理法の性能評価 (偏微分方程式の数値解法とその周辺II)
- テネシー大学計算機科学科
- C-2. 研究におけるコンピュータの利用環境の向上
- テネシー大学におけるHigh Performance Computing
- テネシー大学計算機科学科(CS. UTK. EDU)紹介(海外情報)
- 圧縮性LESを用いたエアリード楽器の発音機構の数値解析 (数値解析と数値計算アルゴリズムの最近の展開)
- LESを用いた2次元および3次元エッジトーンの数値解析
- 大規模素因数分解のための高性能計算環境の実現(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 大規模素因数分解のための高性能計算環境の実現(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 疎行列固有値解法における4倍精度演算とその性能評価
- 疎行列固有値解法における4倍精度演算とその性能評価
- 大規模並列環境における疎行列固有値解法の性能予測
- 1-105 ワークショップを中心とした情報検索演習に関するプログラムの構築 : 工学院大学情報学部における初年次教育の事例((01)基礎科目の講義・演習-I,口頭発表論文)
- 反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化
- 1L-8 MPIを用いたハードディスクドライブシミュレータプログラムの並列化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- マイクロマグネティックシミュレータの OpenMP による高速化
- OpenMPを用いた帯行列に対する直接解法の並列化(数値計算)
- 非対称行列から生成された対称行列に対するCG法 (数値解析と新しい情報技術)
- 科学技術シミュレーションにて多用される代数的多重格子法の評価
- AMG法の自動パラメタ選択手法について
- AMG法のパラメタと性能に関する考察
- 並列非線型共役勾配法アルゴリズムとその性能評価
- 領域分割による並列AMGアルゴリズム
- 並列直接解法によるSmoothed Aggregation MG法の改良と評価(高性能計算及び一般)
- 領域分割による並列AMGアルゴリズム
- 1L-6 GPGPUを利用した疎行列ソルバの高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1L-5 Cell/B.E.による疎行列ベクトル積の高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PowerXCell 8iによる磁気記録シミュレータの高速化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 複数アーキテクチャ上での疎行列ベクトル積の性能最適化手法
- 前処理付固有値解法の誤差評価
- 前処理付固有値解法の誤差評価
- 疎行列固有値解法における前処理の特性について(数値計算IV)
- 並列線形計算ライブラリLis上への固有値解法群の実装と特性評価(HPC-9:数値計算II,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 線形計算ライブラリを用いた共役勾配法系固有値解法の実装と評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 線形計算ライブラリを用いた共役勾配法系固有値解法の実装と評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 線形計算ライブラリを用いた共役勾配法系固有値解法の設計と実装(HPC-9 : 数値解析II)
- GF(2)上巨大疎行列に対する共役勾配法の適用と評価(HPC-16 : 数値計算)
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 高帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価(分散共有メモリと通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 高帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価(分散共有メモリと通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- InfiniBandクラスタを用いた疎行列線形代数演算ライブラリの効率的な実装技術(HPC-6: 高速ネットワークとその応用)
- GPGPUを用いたAMG法
- TSPにおけるアントコロニー最適化法のGPUによる高速化
- 実空間法の特性について
- 流体解析を対象としたAMGライブラリの自動チューニング
- AMGライブラリのMPI/OpenMPハイブリッド並列による高速化
- 2次元および3次元モデルを用いたエッジトーンの数値解析 (オイラー方程式の数理 : 力学と変分原理250年)
- 時間方向並列化の線形計算への適用可能性
- 22pPSB-74 流体音に於ける移動境界問題 : 音源としての移動境界(22pPSB 領域11ポスターセッション,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- マルチGPUを用いたAMG法
- 3次元エアリード楽器の流体音源と発振特性 (オイラー方程式の数理 : カルマン渦列と非定常渦運動100年)
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPUのダイレクト通信を用いたAMG法
- GPUのダイレクト通信を用いたAMG法
- Smoothed Aggregationに基づくAMG法における分散アグリゲートの集約による通信の最適化
- マルチカラー法を用いたマルチGPU上でのAMG法(情報・システム基礎,学生論文)
- SMAC法による流体解析を対象としたAMGライブラリの自動チューニング方式(ソフトウェアシステム)
- APU上の混合精度AMG法
- 情報量基準ABICによるデータの当てはめの制約条件付き問題への適用
- Strassenのアルゴリズムを用いた行列積自動チューニングライブラリ(情報・システム基礎,学生論文)
- マルチカラー法を用いたマルチGPU上でのAMG法