LINPACKベンチマークの並列ベクトル処理 : 並列計算機AP1000用数値演算アクセラレータによる実現
スポンサーリンク
概要
- 論文の詳細を見る
LINPACKベンチマークに並列化とベクトル化を施し,NCA付きAP1000を用いて性能を評価した,LINPACKの並列化では負荷が均等でかつデータパラレル実行が可能となるようにデータを分散させ,ブロッキングを施すことによって行列積演算や外積演算といったベクトル化が容易でかつ高い性能が得られる演算に帰結させた.理論ピーク性能に対して,単体実行時で61%,並列実行時で47%の性能が得られた,また,1000×1000の行列を解く場合,NCAを付加した16セルで,NCAを付加しない128セルのAP1000とほぼ同等の性能が得られた.
- 一般社団法人情報処理学会の論文
- 1995-07-15
著者
-
清水 俊幸
富士通
-
堀江 健志
富士通株式会社
-
堀江 健志
(株)富士通研究所
-
石畑 宏明
富士通株式会社
-
清水 俊幸
(株)富士通研究所並列処理研究センター
-
石畑 宏明
富士通(株)
-
上村 和人
富士通(株)
関連論文
- PM/InfiniBand-FJ : InfiniBandを用いた大規模PCクラスタ向け高性能通信機構の設計(ネットワーク)
- Mesh・Torusネットワーク上での最適全対全通信アルゴリズムの評価
- NSIM:将来の大規模相互結合網を対象とした通信シミュレータの開発
- GIPSY-グラフィクス/イメージ処理システムーの構成
- パケットペーシングを用いた最適全対全通信アルゴリズムのシミュレーション評価
- 2次元Meshネットワーク・Torusネットワーク上での最適全対全通信アルゴリズム
- SMPクラスタ向け並列処理実行環境の構築
- Kaiser : 128-CPU SMPサーバの構成と評価
- AP1000互換通信ライブラリ : WSクラスタ向けの新しい計算環境 : 実装と評価
- AP1000互換通信ライブラリ : WSクラスタ向けの新しい計算環境 : 基本コンセプト
- AP1000+におけるSplit-Cの実装と実行性能の評価
- AP1000+におけるMicrokernel IPCの実装と評価
- 128-CPU SMP PRIMEPOWERシリーズの構成と実装
- 高並列計算機AP1000+のメッセージハンドリング機構
- AP1000+:並列化コンパイラをサポートするアーキテクチャ
- AP1000+:並列化コンパイラをサポートするアーキテクチャ
- メッセージ通信の分散メモリ型並列計算機性能への影響 : 通信と演算のオーバラップと直接メッセージ受信の効果
- 分割再構成可能なトーラスネットワーク
- アクティブ・メッセージによる並列プログラム実行性能の改善
- トーラスネットワークにおける最適全対全通信方式 (並列処理)
- トーラスネットワークにおける最適全対全通信方式
- 高並列計算機AP1000のアーキテクチャ
- 並列計算機AP1000における相互結合網のルーチング方式
- 高並列コンピュ-タAP1000
- 並列計算機用ネットワークのルーティング方式
- 高並列計算機CAP (並列処理ハ-ドウェアと言語特集)
- 高並列計算機CAPとコンピュータグラフィックスヘの応用(第5回航空機計算空気力学シンポジウム論文集)
- 並列計算機AP1000用数値演算アクセラレータの構成と評価
- PRIMEPOWER2000/1000/800のハードウェア (特集 インターネット時代の中核サーバ「PRIMEPOWER」)
- LINPACKベンチマークの並列ベクトル処理 : 並列計算機AP1000用数値演算アクセラレータによる実現
- Dataparallel-Cを用いたベクトル化コード生成とAP1000への実装
- 高速メッセージハンドリング機構 : AP1000における実現
- 高並列計算機AP1000のB-Netアーキテクチャと評価
- スカラパラレルサ-バAP3000のハ-ドウェア (特集 HPC(High Performance Computing))
- 交番検査方式による2線式符号検査回路の構成
- 高並列計算機AP1000の性能評価ツール
- スーパーコンピュータ「京」の構成と評価(計算機システム,システム開発論文)