CUDAに適用したループ再構築手法の評価
スポンサーリンク
概要
- 論文の詳細を見る
本縞では,既存のプログラムを高速化するために,GPGPU (General Purpose Computing on Graphic Processing Unit) のためのループ再構築手法を適用し,評価する.GPGPU で用いる GPU (Graphic Processing Unit) として,tesla C1060 を採用する.tesla C1060 では GPGPU 用開発環境である CUDA が使用可能である.本縞において,ループ再構築手法例としてストリップマイニングとループ交換を取り上げる.これらのループ再構築手法に対してサンプル・プログラムを適用した際の性能評価を行う.その結果,ストリップマイニングでは分割数の変化によってループアンローリングが適用され,実行時間に影響がでることが分かった.一方ループ交換では,データへのアクセス順序を考慮することによって高速化が可能であることが判明した.これらの結果を踏まえ,実プログラムにおける性能を評価するために,k-means 法にストリップマイニングを,メディアンフィルタにループ交換を適用する.
- 2010-09-21
著者
-
城 和貴
奈良女子大学
-
高田 雅美
奈良女子大学
-
城 和貴
奈良女子大学大学院人間文化研究科
-
小郷 絢子
奈良女子大学
-
城 和貴
奈良女子大学大学院 人間文化研究科
-
高田 雅美
奈良女子大学大学院 人間文化研究科
関連論文
- 4K7 視覚特性(オクリュージョン効果)を利用した教育への試み(革新的な初等・中等教育の実践,21世紀の教育改革の行方を探る)
- 大容量データ向け対話的実時間遠隔可視化装置の実現性検討(ストレージと可視化,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの予備評価(高性能計算とアクセラレータ)
- Cellプロセッサへの分子動力学シミュレーションの最適化
- タンパク質立体構造における時系列特徴抽出
- 可視化されたデータ依存の分類とその並列化手法への適用
- 書字運動の訓練支援ソフトウェアの開発(福祉と音声処理,一般)
- ニンテンドーDSを用いた書字学習トレーニングソフトの開発(Session 4)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- リアルタイムアナグリフ動画像生成