分散メモリ型並列計算機による多倍長平方根の高速計算法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 分散メモリ型並列計算機において, 多倍長桁数の平方根を高速に計算する方法について述べる。多倍長桁数の平方根の計算は, 平方根の逆数に収束するニュートン法を適用することにより, 多倍長桁数の加減乗算に帰着される。N桁の多倍長桁数の乗算はFFT(高速フーリエ変換)を用いればO(NlogNloglogN)のオーダーで求まるが, 多倍長桁数の乗算の計算コンポーネントであるFFTの計算及び最終結果の正規化の部分を並列化した。さらに, 実際の計算におけるキャリーおよびボローが確率的に発生しにくくなるように平方根の計算式を変形することで, 高速に求めることができた。
- 一般社団法人情報処理学会の論文
- 1996-10-04
著者
関連論文
- SR11000/J2における4倍精度演算を改良したFFTの実装と評価(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 複数多項式によるMBPSの改善とHITACHI SR11000/J2での実装評価(並列計算,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- SR11000モデルJ2における4倍精度積和演算の高速化(数値計算)
- 演算加速機構を持つオンチップメモリプロセッサの電力性能評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- SIMD型超並列計算機における素因数分解
- 発見科学の構想と展開(発見科学)
- T2K筑波システムにおけるLinpack性能評価(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- EthernetマルチリンクによるPCクラスタ向け高バンド幅・耐故障ネットワークRI2N/UDP(ネットワーク)
- tagged-VLANとマルチリンクに基づくPCクラスタ向け高性能・耐故障ネットワークの実装と評価(Session 3:Cluster/Grid)
- VFREC-Net : ドライバ制御によるtagged-VLANを用いたPCクラスタ向けマルチパスネットワーク(ネットワーク)
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- PCクラスタにおける電力実行プロファイル情報を用いたDVS制御による電力性能の最適化(クラスタシステム)
- ブロック幅を動的決定する疎行列連立一次方程式の直接解法
- 自動チューニング機構が並列数値計算ライブラリに及ぼす効果
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 積和演算命令に向いた8基底FFTカーネルの提案
- 級数に基づく多数桁計算の演算量削減を実現する分割有理数化法
- 積和演算に向いた8基底FFT Kernelの提案
- 無限級数に基づく多数桁計算の演算量削減を実現する分割有理数化法 (数値計算における前処理の研究)
- 分散メモリ型並列計算機による円周率の515億桁計算
- 分散メモリ型並列計算機による2, 3, 5基底一次元FFTの実現と評価
- 多数桁の円周率を計算するための公式の改良 : ガウスールジャンドルの公式とボールウェインの4次の収束の公式
- 分散メモリ型並列計算機による円周率の高精度計算
- 並列計算機における二次記憶を用いた一次元FFTの実現と評価
- 分散メモリ型並列計算機による多倍長平方根の高速計算法
- 分散メモリ型並列計算機による2, 3, 5基底のFFTの実現と評価
- 分散メモリ型並列計算機による高速多倍長計算
- 多倍長平方根の高速計算法
- 行列積を用いた古典Gram-Schmidt直交化法の並列化
- PACS-CSにおける隣接通信性能の高速化(HPC-13 : 通信II)
- 演算加速機構を持つオンチップメモリプロセッサの検討と電力性能評価
- DVFS制御を目的としたプログラムの領域分割(Session 6:低消費電力)
- MegaProto/Eにおける電力性能評価および電力性能最適化の検討(Session 6:低消費電力)
- DVS制御による負荷不均衡のある並列プログラムの電力量削減手法(クラスタシステム)
- PCクラスタにおける全体電力プロファイルを用いた電力性能最適化(ARC-1:低電力アーキテクチャ,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 超並列クラスタにおける3D-RISMへのVolumetric並列三次元FFTの適用と性能評価
- 拡張ヒュッケル法による分子構造最適化並列処理-分子構造の簡易高速生成の試み-
- ブロック幅を動的決定する疎行列連立一次方程式の直接解法
- 超並列処理に向く効果的な並列固有値計算法(並列処理)
- CGSS : ソートを用いた新しいGram-Schmidt直交化法
- 分散メモリ型並列計算機に向くHessenberg形への変換アルゴリズムとその有効性
- 分散メモリ型並列計算機によるブロック化Householder法の性能評価
- 並列固有値ソルバーの実現とその性能
- 分散メモリ型並列計算機による固有値計算のためのブロック化Householder法の性能評価
- 分散メモリ型並列計算機によるHouseholder法の性能評価
- オンチップメモリプロセッサでの演算加速機構の検討 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 複雑な制御構造を持つプログラムのSIMD命令セットによる最適化
- π(χ)の計算におけるパラメータの選択に関する考察(Session 1:素数計算)
- 計算精度を考慮したGMRES法
- 並列疎行列ベクトル積における最適なアルゴリズム選択の効果
- 並列疎行列ベクトル積における最適なアルゴリズム選択の効果
- PCクラスタにおける並列数値計算ライブラリILIBの性能評価
- メモリ使用量の少ない一般化共役残差法の提案
- メモリ使用量の少ない一般化共役残差法の提案
- 2000-HPC-82-29 データの分布に着目した並列ソーティングアルゴリズムの性能評価
- 2000-HPC-82-7 異機種並列計算機における連立一次方程式ライブラリの性能評価
- 2000-HPC-82-5 ILIB_RLU : 疎行列を密行列として扱う自動チューニング機能付きLU分解ルーチンの性能評価
- 名誉会員 後藤英一博士を偲ぶ
- スーパーコンピュータの今後の動向
- 2000-NL-137-1 近代日本小説家8人による文章のn-gram分布を用いた著者判別
- n-gram分布を用いた近代日本語小説文の著者推定
- 30p-PSA-68 第一原理計算による水素結合性液体の研究
- 28a-PS-138 実空間における大規模電子状態計算法
- テント写像に基づいた擬似乱数生成法
- ロジスティック写像による擬似乱数発生法
- 演算加速装置に基づく超並列クラスタHA-PACSによる大規模計算科学
- 補間を用いたFFTの実装と評価
- Fibonacci数の高速計算法
- 自動チューニング機能付き並列数値計算ライブラリ構築の試み : 対称疎行列用の連立一次方程式ソルバを列にして
- 自動チューニング機能付き並列疎行列連立一次方程式ソルバの性能
- AND/OR木探索における証明数・反証数を用いた新しい探索法の提案とその評価
- 一般化した二重指数分割に基づく数値表現法
- 並列言語XcalableMPのアクセラレータ向け言語拡張のOpenCL実装
- 「HIDM」による固有値問題, 境界値問題の数値解析法-トーナメント式多分割シューティング法
- 大規模GPUクラスタにおけるN体計算コードの演算性能とスケーラビリティの評価
- 微分方程式の新しい数値計算技法「HIDM」--常微分方程式への適用
- 2階線形常微分方程式のモノドロミ保存変形に現われた数式処理について