マルチコア環境における自動チューニング機能付き疎行列反復解法ライブラリ
スポンサーリンク
概要
著者
関連論文
- SR11000/J2における4倍精度演算を改良したFFTの実装と評価(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 複数多項式によるMBPSの改善とHITACHI SR11000/J2での実装評価(並列計算,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- SR11000モデルJ2における4倍精度積和演算の高速化(数値計算)
- 相乗り通信を利用したソフトウェアDSMの通信回数削減手法(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 1.ソフトウェア自動チューニングの枠組み(概論,科学技術計算におけるソフトウェア自動チューニング)
- 「Cellスピードチャレンジ2008」実施報告(ARC-6:通信およびコンテスト報告,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ソフトウェア自動チューニングにおける標本点逐次追加型性能パラメータ推定法の疎行列計算への適用(数値計算)
- マルチコアプログラミングコンテスト「Cellスピードチャレンジ2007」実施報告(ARC-11 : シミュレータおよびコンテスト報告,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- Alphaアーキテクチャ用COINSマシン記述の実装とGCCとの比較
- ソフトウェア自動チューニングにおける標本点逐次追加型性能パラメータ推定法(数値計算,数理計画法)
- 通信量の密度に着目したS-DSM開発支援ツールS-CATの機能拡張(セッション2)
- ソフトウェアDSM MochaとMPIの並列ベンチマークを用いた性能評価(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 電力的制約を考慮した低消費電力指向最適化コンパイラ(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 量子i.i.d.状態における仮説検定の漸近特性に関する数値的アプローチ
- CPUとGPUを用いた並列GEMM演算の提案と実装(数値計算)
- MPIとの比較によるソフトウェアDSMの性能評価(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- Effect on Run-time Auto-tuning for the Multi-section with Multiple Eigenvalues Method
- 不均質なクラスタ環境を対象とするデータ再配置による動的負荷分散機構の設計と実装(会場A)
- Multi-section with Multiple Eigenvalues Method for Computing Eigenvalues in Symmetric Tridiagonal Eigensolvers(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- Multi-section with Multiple Eigenvalues Method for Computing Eigenvalues in Symmetric Tridiagonal Eigensolvers(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- S-DSMシステムにおけるページ要求時の受信通知を削減する方式(ソフトウェア分散共有メモリ)
- 6.自動チューニング機能付き数値計算ライブラリ(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- SIAM CSE09(Conference Reports)
- マルチコア環境における自動チューニング機能付き疎行列反復解法ライブラリ
- 自動チューニング機構が並列数値計算ライブラリに及ぼす効果
- Segmented Scan法のCUDA向け最適化実装
- OpenATLib:数値計算ライブラリ向け自動チューニングインタフェース
- Xabclib : 汎用的自動チューニングインターフェースOpenATLibを利用した反復解法ライブラリの開発(数値計算のための自動チューニング(続))
- 行列計算ライブラリ向け数値計算ポリシーインターフェースの提案
- 自動チューニングインターフェースOpenATLibにおける疎行列ベクトル積アルゴリズム
- OpenATLibを利用した疎行列ライブラリの開発と評価
- OpenATLib:汎用的な自動チューニングインターフェースの設計と実装
- ソフトウェアDSM MochaとMPIの並列ベンチマークを用いた性能評価(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 電力的制約を考慮した低消費電力指向最適化コンパイラ(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- CPUとGPUの並列処理による行列積和演算方式の提案(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- Bimode-Plus分岐予測器の提案(プロセッサアーキテクチャ)
- 3次元津波伝搬シミュレーションにおけるコード最適化一手法
- Segmented Scan 法のCUDA向け最適化実装
- 28aTK-5 相対論的流体における非平衡現象について(28aTK 波動,輸送・拡散,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 20aSG-1 一般相対論的気体論コードの作成に向けて(20aSG 宇宙物理,宇宙線・宇宙物理領域)
- MPIを用いた超高次元分布関数による流体のメゾスケール解析(HPC-9 : 数値計算アルゴリズム(2))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 5X-6 USBカメラを用いた防犯システムの構築(画像処理・認識(3),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 「Cellチャレンジ2009」実施報告
- 「Cell チャレンジ2009」実施報告
- SIAM AN10(Conference Reports)
- マルチコアプロセッサにおけるリオーダリング付き非構造格子向け前処理付反復法の性能
- Windowsクラスタにおける疎行列反復解法ソルバの自動チューニング(HPC-3:自動チューニングI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 複雑な制御構造を持つプログラムのSIMD命令セットによる最適化
- π(χ)の計算におけるパラメータの選択に関する考察(Session 1:素数計算)
- 計算精度を考慮したGMRES法
- 並列疎行列ベクトル積における最適なアルゴリズム選択の効果
- 並列疎行列ベクトル積における最適なアルゴリズム選択の効果
- PCクラスタにおける並列数値計算ライブラリILIBの性能評価
- メモリ使用量の少ない一般化共役残差法の提案
- メモリ使用量の少ない一般化共役残差法の提案
- 2000-HPC-82-29 データの分布に着目した並列ソーティングアルゴリズムの性能評価
- 2000-HPC-82-7 異機種並列計算機における連立一次方程式ライブラリの性能評価
- 2000-HPC-82-5 ILIB_RLU : 疎行列を密行列として扱う自動チューニング機能付きLU分解ルーチンの性能評価
- 自動チューニングインターフェース OpenATLib における疎行列ベクトル積アルゴリズム
- とびらの言葉
- RAO-SS : Autopilotを用いた疎行列ソルバにおける実行時自動チューニング機構(数値計算アルゴリズム(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- RAO-SS : Autopilot を用いた疎行列ソルバにおける実行時自動チューニング機構
- SimCore/Alpha Functional Simulatorの設計と実装(VLSI設計支援システム, システム開発論文)
- とびらの言葉
- フォッカー・プランク方程式の解の構造について(分子スケール(3),一般講演)
- 2原子分子解離の気体論的定式化とその数値的検証(空気力学・高エンタルピー流(2),一般講演)
- 相対論的非平衡希薄気体の解析(宇宙流体(3),一般講演)
- 三次元有限要素法アプリケーションにおける行列生成処理のCUDA向け実装
- 三次元有限要素法アプリケーションのCUDA向け実装と性能評価
- 自動チューニングインターフェースOpenATLibにおける自動チューニング機能の評価
- 補間を用いたFFTの実装と評価
- HxABCLibScript:非均質計算機向け自動チューニング記述言語拡張
- 自動チューニング機能付き並列数値計算ライブラリ構築の試み : 対称疎行列用の連立一次方程式ソルバを列にして
- 自動チューニング機能付き並列疎行列連立一次方程式ソルバの性能
- AND/OR木探索における証明数・反証数を用いた新しい探索法の提案とその評価
- 収束障害(Fault Convergence):数値計算ソフトウェアにおける新しい安全性の概念