GPU向けメモリマシンモデル上の最適な並列接頭部和アルゴリズム(GPGPU,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, GPU向けの理論計算モデルDMMとUMM上の最適な並列接頭部和アルゴリズムを示す.これらのモデルは,3つのパラメタ,スレッド数p,メモリ幅w,メモリアクセスレイテンシlを持つ.まず,n個の数の合計がO(n/w+(nl)/p+llog n)時間で求められることを示す.そして,合計を求める計算が少なくともΩ(n/w+(nl)/p+llog n)時間必要であることを示す.最後に,接頭部和が最適なO(n/w+(nl)/p+llog n)時間で求められることを示す.
- 一般社団法人電子情報通信学会の論文
- 2012-07-26
著者
関連論文
- 教育用・小規模組込みシステム用の超小型プロセッサと言語処理系
- 教育用・小規模組込みシステム用の超小型プロセッサと言語処理系
- 小型組込みシステムと教育のためのFPGA向けTiny Processing System(応用2)
- COMP2000-24 マルチホップパケット無線ネットワーク上のブロードキャストの確率アルゴリズム
- An efficient implementation of exhaustive verification of the Collatz conjecture using DSP48E blocks of Xilinx Virtex-5 FPGAs (リコンフィギャラブルシステム)
- FPGAのDSPブロックを最大限利用するRSA暗号ハードウェアアルゴリズム (ワイドバンドシステム)
- FPGAのDSPブロックを最大限利用するRSA暗号ハードウェアアルゴリズム (情報セキュリティ)
- FPGAのDSPブロックを最大限利用するRSA暗号ハードウェアアルゴリズム (情報処理)
- FPGAを用いたコラッツ予想の検証(応用3)
- ロジックエレメントを節約したFPGAラベリング(応用1)
- FPGAを用いたk-Concaveな二値画像に対するラベリング
- D-8-19 情報取得能力の多様化による複数種生物の共存と進化の研究
- Xilinx Virtex-5 FPGAのDSP48Eブロックを用いたコラッツ予想の検証の効率的実装(システムアーキテクチャ)
- FPGAを用いたCKYパージングの高速化
- シングルホップ・シングルチャネル無線ネットワーク上の時間と電力消費について最適な確率的ルーティング
- シングルホップ無線ネットワーク上の省電力初期化アルゴリズム
- ワイヤレスセンサーネットワーク上の基本プロトコル
- ワイヤレスセンサーネットワーク上の省電力初期化アルゴリズム
- アドホック無線ネットワーク上の省電力初期化アルゴリズム
- マルチホップパケット無線ネットワーク上のブロードキャストの確率アルゴリズム
- COMP2000-25 アドホック無線ネットワーク上の省電力初期化アルゴリズム
- FPGAのDSPブロックを最大限利用するRSA暗号ハードウェアアルゴリズム(一般:情報通信基礎サブソサイエティ合同研究会)
- FPGAのDSPブロックを最大限利用するRSA暗号ハードウェアアルゴリズム(一般:情報通信基礎サブソサイエティ合同研究会)
- FPGAのDSPブロックを最大限利用するRSA暗号ハードウェアアルゴリズム(一般:情報通信基礎サブソサイエティ合同研究会)
- COMP2000-23 マルチスレッドアーキテクチャへの高級言語を用いた並列アルゴリズムのインプリメント
- PRAMアルゴリズムのマルチスレッドアーキテクチャへのインプリメントと評価
- 再構成メッシュ上の並列アルゴリズムの視覚化ツール
- 再構成メッシュ上でO((loglog n)^2)時間で凸包を求めるアルゴリズム
- 重みのある場合とない場合に, k 個のソートされた列に対する選択問題を解くアルゴリズム
- 近接点を見つける最適な並列アルゴリズムとその応用
- 組合せ論理回路に対するイベント駆動による再評価
- 復元画像の最適化によるハーフトーン化 : ハードウェアによる高速化を含めた新しい手法
- さまざまなスクリーニング法 (特集:プリンティング・テクノロジー2008)
- Juraj Hromkovic, 和田幸一, 増澤利光, 元木光雄 訳, 計算困難問題に対するアルゴリズム理論, Algorithmics for Hard Problems, シュプリンガーフェアラーク東京, 2005年
- Direct Binary Search 法によるマルチトニング(計算機科学の理論とその応用)
- 無線通信プロトコルの理論的研究の現状(オピニオン)
- FPGAを用いた画像検索システム
- FPGAを用いた画像検索システム
- kチャンネル放送通信モデル上の時間と消費電力について最適なリストランキングアルゴリズム
- 無線ネットワーク上のユニフォームなリーダ選択プロトコル
- 衝突検出のない無線ネットワーク上のリーダ選択プロトコル
- 衝突検出できない無線ネットワーク上の省電力初期化プロトコル
- 動的可変バスをもつ並列計算機上の定数時間アルゴリズム
- 二分決定木を用いた論理関数の質問処理
- 仕事・時間量について最適なPRAM上のkマージアルゴリズム
- 基本再構成メッシュ上の行最小値計算のための効率よいアルゴリズム
- An Optimal Algorithm for the Angle-Restricted All Nearest Neighbor Problem on the Reconfigurable Mesh
- An FPGA Implementation for 3-layer Perceptron with the FDFM Processor Core Approach (リコンフィギャラブルシステム)
- バリア同期付き非同期メモリマシンモデル
- バリア同期付き非同期メモリマシンモデル
- FDFMアプローチを用いた3層パーセプトロンのFPGA実装(数値計算と高速化)
- GPU向けメモリマシンモデル上の最適な並列接頭部和アルゴリズム(GPGPU,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
- FPGAのDSPブロックとブロックRAMを用いたハフ変換の実装(ハードウェア,クラウド、ネットワーク及び一般)
- GPUを用いた巡回セールスマン問題に対する蟻コロニー最適化の効果的な実装(GPU・マルチコア,クラウド、ネットワーク及び一般)
- コンフリクトフリーなオフライン置換のGPU実装(GPU・マルチコア,クラウド、ネットワーク及び一般)
- バリア同期付き非同期メモリマシンモデル(演算機構,組込み技術とネットワークに関するワークショップETNET2013)
- バリア同期付き非同期メモリマシンモデル(演算機構,組込み技術とネットワークに関するワークショップETNET2013)
- GPUにおける局所的網羅探索を用いたアスキーアート生成法(アクセラレータ,並列/分散/協調とディペンダブルコンピューティング及び一般)
- FPGAのDSPスライスを用いたテンプレートマッチング(アクセラレータ,並列/分散/協調とディペンダブルコンピューティング及び一般)
- Hierarchical Memory Machine上の最適なオフライン置換アルゴリズムとGPU実装(アクセラレータ,並列/分散/協調とディペンダブルコンピューティング及び一般)
- FDFMアプローチを用いた3層パーセプトロンのFPGA実装