動的リンクライブラリを用いた実行時最適化の評価
スポンサーリンク
概要
- 論文の詳細を見る
数値計算プログラムでは, ループアンローリングなどのループ最適化の効果が大きい.ループ最適化に用いるアンローリング段数などのパラメータの値は, 使用する計算機で最適な値が異なるため, コンパイル時に最適な値を解析することは困難である.そこで, 我々は計算機に適したループの最適化を実行時に行なうことで高速化を図る手法を提案してきた.本稿では, 動的リンクライブラリを利用した実行時最適化手法について述べる.本手法を, C言語の行列積, LU分解のプログラムに適用し, Sun Enterprise450(CPU:Ultra SPARC II 300MHz)で実行した.その結果, 高速化の全てをコンパイラに任せる場合よりも計算時間の短縮されることが示された.
- 社団法人情報処理学会の論文
- 2001-05-25
著者
関連論文
- 公開鍵暗号を用いてプログラムの保護を行うプロセッサの提案(プロセッサアーキテクチャ)
- 線形回帰演算の並列化手法の応用によるDOACROSSループの並列実行
- ディジットシリアル浮動小数点演算器を用いた高精度FFT回路の設計検討(一般セッションC 設計と実装)
- スーパーコンピュータ用拡張記憶の拡張主記憶としての高度利用
- MPIプログラムの自律チェックポインティング方式の実現(HPC-3 : スケジューリング)
- 構造化プログラムに対する静的単一代入形式の生成アルゴリズム
- 動的リンクライブラリを用いた実行時最適化の評価
- 2000-HPC-82-21 Javaクラスファイルの実行時ループ最適化手法
- 2000-HPC-82-18 ウェーブフロント型計算における性能予測モデルの構築
- 実行時情報を用いた性能最適化手法
- 並列化コンパイラTINPARにおける自動データ分割決定手法
- 非均質環境向け並列化コンパイラhetero-TINPER : 動的負荷分散方式の改良
- 並列化コンパイラTINPARによる非均質計算環境向けコード生成手法
- 並列化コンパイラTINPARにおける重複プロセッサ間通信の削減手法
- 並列化コンパイラTINPARにおける自動データ分割部の実現
- 不規則問題に対する並列化コンパイル手法
- 並列化コンパイラTINPARにおけるスカラ変数処理
- 不規則アクセスを伴うループの並列化コンパイル技法 : Inspector/Executorアルゴリズムの高速化
- 分散トランザクションシステム IXI の設計と実現
- 適応型時刻印方式に基づく同時実行制御方式
- データベースオペレーティングシステム μOPT-Rにおける分散セグメンテーション方式
- 実時間オペレーティングシステムR^2/V2におけるタスクグループの実現
- オブジェクト指向オペレーティングシステム Ozone におけるプロセス管理方式
- 複数の並列化手法を統合する並列実行方式
- 分散オペレーティングシステムDM-2におけるメモリ管理部の実現
- 分散オペレーティングシステムDM-2におけるサイトの動的な追加及び切り離し方式
- 分散オペレーティングシステムDM-2におけるスレッドディストリビュータの実現
- 分散仮想記憶に基づくオペレーティングシステムDM-1におけるタスク・スレッドモデル
- 分散仮想記憶に基づくオペレーティングシステムDM-1の構成
- 微細テクノロジ向けDRCルールファイルからの設計規則抽出とその可視化(レイアウト設計検証, システムLSIの設計技術と設計自動化)
- FPAccAアーキテクチャへのラジオシティ法の実装と評価(FPGAとその応用及び一般)
- FPAccAアーキテクチャへのラジオシティ法の実装と評価(FPGAとその応用及び一般)
- FPAccAアーキテクチャへのラジオシティ法の実装と評価(FPGAとその応用及び一般)
- DRCルールファイルからの設計規則抽出とその可視化
- 兎・亀プロセッサの切替えによる低消費エネルギー化の提案(システムオンシリコン設計技術並びにこれを活用したVLSI)
- 兎・亀プロセッサの切替えによる低消費エネルギー化の提案(システムオンシリコン設計技術並びにこれを活用したVLSI)
- IEEE754準拠単精度浮動小数点除算器IPライブラリの開発
- IEEE754準拠単精度浮動小数点除算器IPライブラリの開発
- IEEE754準拠単精度浮動小数点除算器IPライブラリの開発
- DRCルールファイルからの設計規則抽出とその可視化
- DRCルールファイルからの設計規則抽出とその可視化
- DRCルールファイルからの設計規則抽出とその可視化
- 乗算器のBoothリコーダの回路方式について
- 乗算器のBoothリコーダの回路方式について
- 乗算器のBoothリコーダの回路方式について
- FPAccA model 2.0チップの設計 : 再構成可能な浮動小数点演算器アレイ
- FPAccA model 2.0チップの設計 : 再構成可能な浮動小数点演算器アレイ
- 一般二分決定グラフの生成法
- 一般二分決定グラフの生成法
- ベクトル計算機に適したB-スプラインの計算法
- スプライン関数を用いた多次元データの平滑化 : ベクトル計算機向きの算法
- ベクトル計算機に適したB-スプラインの計算法(スーパーコンピュータのための数値計算アルゴリズムの研究)
- 超並列算計機におけるデータ並べ替えアルゴリズムと要求されるデータ転送能力の見積もり
- 異なる長さをもつ表形式データの転置
- 多階層記憶におけるデータ並べかえと記憶階層の最適化
- 実時間オペレーティングシステムR^2用マルチタスクシミュレータの開発R^2シミュレータの言語処理系
- 実時間オペレーティングシステムR^2用マルチタスクシミュレータの開発R^2シミュレータの機能と全体構成
- データベース専用オペレーティングシステムμOPT-Rの分散環境におけるセグメント管理方式
- データベース専用オペレーティングシステムμOPT-Rにおける演算処理方式について
- 再帰的手続きの自動ベクトル化における幅優先法の拡張
- FPAccA model 2.0チップの設計 : 再構成可能な浮動小数点演算器アレイ
- 実時間オペレーティングシステム R^2-86 核のアーキテクチャ
- 実時間オペレーティングシステムR^2-86の開発とその移植性
- 実時間オペレーティングシステムR^2のロボットプリミティブとプロトタイプシステム
- 一般二分決定グラフの生成法
- 線形回帰演算の並列化手法の応用によるDOACROSSループの並列実行
- ベクトル計算のための一次回帰演算の高速アルゴリズム
- 回帰的なデータ参照を伴う演算のベクトル化
- 自動ベクトル化コンパイラにおけるイディオム認識法
- 陽的差分による3次元電磁流体シミュレーションのスーパコンピューティング
- ベクトル計算機のための一次回帰演算の高速アルゴリズムとその並列化(並列処理)
- バルク回帰並列処理 : 依存のあるループの並列実行方式
- 粒子輸送モンテカルロシミュレーションコードの自動並列化
- 粒子輸送モンテカルロシミュレーションコードの自動並列化
- 疎結合並列計算機Paragonの性能評価 : ノード間通信性能の評価を中心に
- 実時間オペレーティングシステムR^2の入出力制御方式
- 実時間オペレーティングシステムR^2の通信管理方式
- 実時間オペレーティングシステムR^2のタスク管理方式
- 実時間オペレーティングシステムR^2の設計目標と全体構成
- 自動ベクトル化並列化コンパイラV-Pascal Ver.3
- 自動ベクトル化並列化コンパイラV-Pascal Ver.3
- 精密な依存解析のための変数値域の静的予測
- 分散メモリ型並列計算機用自動並列化コンパイラV-Pascal/DM
- 分散OS DM-1における障害対策のためのシステム停止機能
- 分散オペレーティングシステムDM-1におけるスレッド分配機構
- バス結合並列計算機モデルにおけるデータ転送の最適アルゴリズム
- 高並列計算機におけるデータ並べ替えの最適化
- バス結合型並列計算機におけるデータ転送の最適アルゴリズム(計算機構とアルゴリズム)
- バス結合マルチプロセッサ型ベクトル計算機における線形計算アルゴリズムの評価
- WHILE型ループの自動ベクトル化,並列化
- Logspace Bounded Alternation and Logical Query Programs
- 多重ループにわたる配列データ依存関係解析法
- 表示的意味論によるC言語の意味記述と処理系作成への応用
- 自動ベクトル化コンパイラのための制御関係解析法
- 電磁流体方程式における高速数値計算法と数値解の評価
- 実時間オペレーティングシステムR^2/V2におけるタスクグループの実現
- ベクトル計算機における拡張記憶の拡張主記憶としての仮想化
- 拡張記憶の拡張主記憶としての仮想化
- データベースを利用したC言語プログラム開発支援システムCbaseの実現
- オブジェクト指向スクリプト言語Rubyへの世代別ごみ集め実装手法の改良とその評価