CUDAによるランダムスパース方程式求解の命令レベル並列性を用いた高速化手法
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,CUDA GPUにおいて実非対称(ランダムスパース)な構造を持つ方程式の求解を高速化するために,スタティックスケジューリングによって抽出した命令レベル並列性を用いてベクトル命令を生成するアルゴリズムを提案する.従来より,ランダムスパース方程式求解には直接法が用いられている.直接法によるランダムスパース方程式の求解は,零要素を含む演算を省くことで効率良く実行できる.よって,CUDA GPU上で演算の効率を高めるためには,スタティックスケジューリングを用いて零演算を含まない演算のみを抽出しベクトル化する.本手法は,方程式を求解する際に実行可能であるという組合せの情報のみを抽出することで,ベクトル化する.しかし,従来のように実行可能であるという組合せの情報のみからベクトル化するだけでは,高い効率で計算ができない.スケジューリングする際に,依存関係以外の情報も考慮することでCUDA GPUで演算の高速化が期待できる.そこで本論文では,すべての演算の依存関係を用いてスタティックスケジューリングを行うことで同時に実行可能な演算を抽出し,ベクトル化する.本手法によるスケジューリングでは,同時に実行可能な命令のうち,依存関係を多く持つ演算から優先的にベクトル化することでCUDA GPUによる効率的な演算を可能にする.
- 2014-01-22
著者
関連論文
- 階層的挟み撃ち探索における探索の重複領域の削減手法
- ニュートン補間法によるベクトル予測を用いた動きベクトル検出処理の高速化手法(一般セッション(4))
- 4Y-2 初心者のための気象情報システムの構築(情報システムの構築(1),一般講演,コンピュータと人間社会)
- 5X-9 コンピュータ用語による英語学習システム(教育支援システム,一般講演,コンピュータと人間社会)
- 2X-6 WWWを利用したドイツ語入門講座
- 2S-7 気象情報システムの構築 : wwwを用いた初心者向け気象学習支援
- 3K-4 電力過渡安定度計算の効率的な処理方法に関する研究
- 英単語発音学習システムの構築
- インタラクティブWebアンケートシステム
- 気象情報システムの構築
- D-3-9 先読みを考慮したヒューリスティックスケジューリングアルゴリズム
- 5W-2 VRMLによる環境学の研究(情報システムのフロンティア,一般講演,コンピュータと人間社会)
- 3G-3 電力過渡安定度計算の並列同時解放における系統分割の適用
- B-028 ストリーミングSIMD拡張命令を用いた電子回路シミュレータSPICE3の高速化(B分野:ソフトウェア,一般論文)
- 編集にあたって(マルチコアにおけるソフトウェア)
- 2S-1 データベース型電子掲示板
- 3J-2 WWWを利用した点字学習者支援環境
- 5H-4 火災シミュレータにおける評価支援システム
- 1Q-10 FTPを用いたマルチメディアメールシステムの構築
- WWWを利用した日本語点字学習者のための支援環境の構築
- 点字学習者支援システムの構築
- データベース型電子掲示板の試作
- Javaによる火災シミュレータの構築
- マルチメディアメールシステム
- B-025 評価関数の精度による階層的挟み撃ち探索の性能評価(B分野:ソフトウェア,一般論文)
- 証明数・反証数を用いた反復深化法における複数経路並行探索の並列化(HPC-6 : 並列アプリケーション)
- AND節点の並列探索を加えたAND/OR木階層的挟み撃ち探索(アルゴリズム)
- 一般化調和解析を併用したベクトル量子化による画像符号化
- 証明数・反証数を閾値とした反復深化法の複数経路同時探索による高速化(数値計算アルゴリズム(2), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- AND/OR木における証明数・反証数を用いた階層的挟み撃ち探索(アルゴリズム・数値計算)
- MATLABからC言語への変換における変数の動的解析削減手法(HPC-12 : 最適化と性能評価)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 命令キャッシュを考慮したコード生成法による方程式求解の高速化手法(ARC-4 : 実行スケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- AND/OR木におけるAND節点に対する並列探索の評価(CPSY-3 性能評価)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 一般化調和解析とベクトル量子化の併用による画像圧縮
- D-11-57 一般化調和解析を用いたベクトル量子化による画像圧縮の改善
- D-14-17 一般化調和解析の処理効率の向上に関する研究
- A-8-4 ビリヤード習得のための学習システムの構築
- D-11-160 共有メモリ型並列コンピュータ上のステレオマッチングの並列処理手法
- A-8-3 携帯電話を用いたネットワーク投票システムの試作
- A-8-1 ビリヤード支援システムの構築
- J-19 小領域分割法によるステレオマッチングのプロセッサ割り当て手法(画像処理2-1,J.グラフィクス・画像)
- キャッシュヒット率を考慮したステレオマッチングの並列処理
- G-27 局面評価値による重み付けを利用した反復深化法の並列処理手法(人工知能(一般),G.人工知能)
- D-8-20 共有メモリ型並列計算機における詰将棋プログラムの階層型挟み撃ち探索
- D-3-10 クラウト法を用いた電力系統過渡安定度計算の粗粒度並列処理手法
- 配列間接アクセスを用いないコード生成法による電子回路シミュレーションの高速化とその並列処理
- 配列間接アクセスを用いないコード生成法による電子回路シミュレーションの高速化とその並列処理
- K_011 e-Learningにおける学習支援システム(K分野:ヒューマンコミュニケーション&インタラクション)
- K-031 古本屋支援システム(K分野:ヒューマンコミュニケーション&インタラクション)
- Webを利用したフィッシングエリア情報サービス
- 証明数・反証数を閾値とした反復深化法の複数経路同時探索による高速化(数値計算アルゴリズム(2), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- Web 3DによるMind Storms実験支援システム
- D-6-10 分散メモリ型計算機による有限要素・境界要素併用法の高速化(D-6. コンピュータシステム)
- D-17-4 モンテカルロ法を用いたデリバティブ・プライジングの並列処理手法
- D-3-1 コード生成法によるループフリーコードの計算手法
- A-8-3 XVLによるロボット実験支援システム
- A-8-2 Javaによる環境学習支援システムの試作
- 時間依存性のない線形素子による定数伝播を用いた電子回路シミュレータSPICE3の高速化
- 時間依存性のない線形素子による定数伝播を用いた電子回路シミュレータSPICE3の高速化
- 時間依存性のない線形素子による定数伝播を用いた電子回路シミュレータSPICE3の高速化
- 時間依存性のない線形素子による定数伝播を用いた電子回路シミュレータSPICE3の高速化
- D-3-8 相関分析におけるapriorTidアルゴリズムの並列処理手法
- 探索の重複領域削減による階層的挟み撃ち探索の高速化 (コンピューティングシステム Vol.4 No.4)
- B-040 GPUのための回路方程式求解における命令レベル並列度の評価(GPGPU,B分野:ソフトウェア)
- B-056 探索の重複領域を削減した階層的挟み撃ち探索による実行時間最小マルチプロセッサスケジューリング問題の求解(並列分散・仮想化技術,B分野:ソフトウェア)
- タスクスケジューリング問題の厳密解求解における探索ノード数削減アルゴリズム
- CUDAによるランダムスパース方程式求解の命令レベル並列性を用いた高速化手法
- GPUのキャッシュヒット率向上によるDEMの高速化