高並列計算機における遠隔データの先行フェッチのためのループ変換手法
スポンサーリンク
概要
- 論文の詳細を見る
並列処理計算機においては演算装置の要素数が増加するに従い、通信網ての遅延が増加し遠隔データのアクセスに時間がかかるようになる。従って、高並列処理のためにはこの遅延に対し耐性のあるアーキテクチャが要求される。データ駆動アーキテクチャは、命令レベルの並列性を取り出すことによって、通信網を含んだ循環パイプラインを実現しこの遅延をキャンセルできると考えられた。しかし、2オペランド命令の実行に2個のデータ入力を必要とする実現においては、データ待ち合わせ部に最初のデータが到着した際、命令実行部には実行すべき命令が送られずパイプラインブレイクを生してしまう (ここでは、データ待ち合わせ部と命令実行部のパイプライン処理速度を同一と見なしているが、 この仮定は、同じ実現技術を用い、両処理部の高い利用率を確保しようとする場合、一般的なものであろう。)この問題の解決には、演算レジスタや実行順序制御の導入等の方法によってデータ転送数を減少させる工夫が必要である。一方、逐次処理型の演算装置を用いた並列処理計算機においては、個々の演算装置内では連続する命令列による縦型パイプライン処理が行なわれている。従ってマルチコンテキスト用の演算レジスタセットがサポートされていたとしても、コンテキスト切り替えの際演算パイプラインに空きが生じてしまうので、できるだけコンテキスト切り替えを行なわない様にする必要がある。すなわち、プロセス間の同期のため待が生じた場合は止むを得ないが、すでに値が入っている遠隔変数を読む場合はできるだけ待が生じないようにしてコンテキスト切り替えの頻度や演算装置の***時間を減少させる必要かある。先行フェッチを可能にするアーキテクチャについては、データ読みだし要求をその番地の内容が確定するまでその番地で持たせる機能を持ったメモリを導入する方法が提案されている。筆者らは、 レジスタ間演算を基本とするRISCアーキテクチャを適用するため、演算レジスタに対し遠隔データのフェッチを行える機構を示した。本稿では、先行フェッチのために必要なハードウェア機能を示した後、プログラムのループ構造部分において、遠隔変数に対するデータフェッチ要求をその使用に先だって先行発行するための手法について述べる。
- 社団法人情報処理学会の論文
- 1989-10-16
著者
-
島田 俊夫
電子技術総合研究所
-
島田 俊夫
電総研
-
戸田 賢二
電子技術総合研究所
-
西田 健次
電子技術総合研究所
-
内堀 義信
電子技術総合研究所
-
西田 健次
産業技術総合研究所
-
戸田 賢二
電子技術総合研究所所
関連論文
- 部分再構成システムにおけるAES-GCMを用いたビットストリームの秘匿と認証(応用1)
- 細粒度並列処理におけるレイテンシ隠蔽効果の評価
- 超高精細映像に対応したバーサタイルメディアプロセッサ : スケーラブルな並列映像オーバレイエンジン(ディジタル・情報家電,放送用,ゲーム機用システムLSI,回路技術(一般,超高速・低電力・高機能を目指した新アーキテクチャ))
- 超高精細映像に対応したバーサタイルメディアプロセッサ--スケーラブルな並列映像オーバレイエンジン (コンシューマエレクトロニクス)
- 78-03 知識と行動に関するReasoning
- パネル討論会 : 専用プロセッサの動向 : 昭和51年度第17回大会報告
- 77-32 LISP のリスト構造に関する実証的研究
- 75-18 GO TO 文を用いるStructured Programming
- 定理証明用言語MICRO-PLANNER について
- 対話形グラフィック・シミュレーション・システム
- 71-28 対話型グラフィックコンソール周辺技術とソフトウェア
- データフロー計算機 SIGMA-1 の基本性能評価
- センサフュージョンのためのリアルタイムパラレルアーキテクチャ
- 実時間用並列計算機アーキテクチャの検討
- 並列記述言語DFCIIの命令レベルデータ駆動計算機に対する構造文処理
- CODAにおけるスキップ機構の導入による共有変数アクセスの効率化
- CODAアーキテクチャ : 命令挿入によるレジスタ上でのデータ待ち合わせ
- 同期構造を埋め込んだSIGMA-1用高級言語DFC II
- 命令レベルデータ駆動計算機における効率的な分岐命令の設計
- 高並列計算機における遠隔データの先行フェッチのためのループ変換手法
- 科学技術計算用データ駆動計算機SIGMA-1における入出力の実現
- SIGMA-1用言語DFCに対する拡張機能の提案
- デ-タフロ-言語DFCの設計と実現
- 3. アーキテクチャ 3.7 データフローマシン (並列処理マシン)
- 特集「並列処理マシン」の編集にあたって
- 科学技術計算用並列計算機におけるベンチマークプログラム : その構成思想
- 科学技術計算用データ駆動計算機SIGMA-1LSI版のネットワーク構成
- 科学技術計算用データ駆動計算機SIGMA-1のモニタ
- 科学技術計算用データ駆動計算機SIGMA-1のソフトウェア環境
- 特集「並列処理技術」の編集にあたって
- ニューラルネットワークによる情動・記憶モデルの構成
- 並列計算機におけるネットワ-クを用いた動的負荷分散機構
- 市販プロセッサとFPGAから構成される計算ノードをもつ実時間並列システムアーキテクチャ
- プロフィールに基づく染色体ソータ
- 外国製計算機への日本語文の埋め込み
- 関数レベルデータ駆動計算機の検討
- 並列処理における動的負荷分散方式 : 帳尻合わせ方式
- 並列構造記述モデルとそれを実現する高水準並列計算機
- インプリサイス計算を用いた柔軟なリアルタイムシステムの構築を目指して
- 場所細胞の位置マップと強化学習を用いた移動ロボットのナビゲーション(画像認識, コンピュータビジョン)
- 場所細胞の位置マップによる移動ロボットのナビゲーション
- ニューラルガスと強化学習による移動ロボットのナビゲーション
- 場所細胞による移動ロボットのナビゲーション
- 海馬の三次元神経回路による連想記憶モデル
- 3S-1 'neuron-oid'系における創発的情報処理(第3報) : 'neuron-oid'での入力間の同期検出
- 能動的記憶システムに関する調査研究
- 感情記憶システムの構想
- 特集「オプトエレクトロニクス」の編集にあたって
- 組込/分散/実時間用JavaにおけるGC及びスケジューリング機構の設計
- 組込/分散/実時間用JavaにおけるGC及びスケジューリング機構の設計
- FTS2000-22 多段網において優先度逆転を抑制するための熱心な優先度先送り方式の提案と評価
- FTS2000-16 インプリサイス計算に基づいた自動車制御スケジューリングとその基本的性能評価
- インプリサイス実時間スケジューリングの予備的性能評価
- 並列・分散をめざした実時間組込み用Javaの基本設計
- インプリサイス計算を用いた自動車走行制御スケジューリングのアシュアランス
- パターンコンピューティング : カーネル学習法と汎化性(知能コンピューティングとその周辺〔第6回〕)
- 可変精度の実時間タスクを重要度により制御するインプリサイススケジューリングの考察
- 組込みから並列・分散までの実時間Javaの統一環境の設計と実装
- 特集「FPGA : その現状、将来とインパクト」の編集にあたって
- 特集「リアルワールドコンピューティング研究計画」の編集にあたって
- IEEE Real-Time Systems Simposium (RTSS'00)及びInt'l Conference on Real-Time Computing Systems and Applications (RTCSA'00)の会議報告
- IEEE Real-Time Systems Simposium (RTSS'00)及びInt'l Conference on Real-Time Computing Systems and Applications (RTCSA'00)の会議報告
- IEEE Real-Time Systems Simposium (RTSS'00) 及び Int'l Conference on Real-Time Computing Systems and Applications (RTCSA'00) の会議報告
- 自己組織的基底配置による関数回帰法の評価
- 複数パイプライン・プロセッサの実時間性能評価
- リアルタイムシステムのハードウエア
- 実時間並列計算機CODAにおけるネットワーク性能の予備的評価
- 実時間処理向き並列ハードウェアエミュレータシステムの構成
- CODAプロセッサにおける実時間処理向きタスクスイッチの性能評価
- 実時間用並列計算機CODAのプロセッサアーキテクチャ
- 優先度先送り方式による実時間相互結合網用ルータチップの実現と性能
- 特集「重点領域研究 : 超並列原理に基づく情報処理基本体系」の編集にあたって (重点領域研究 : 超並列原理に基づく情報処理基本体系)
- 優先度先送り方式による実時間用相互結合網用ルータチップの性能評価
- 矩形特徴を用いた顔検出器から得られる識別スコアの最大化による顔追跡(テーマセッション, 顔・ジェスチャーの認識・理解)
- カーネル学習法とその画像認識への応用(CVにおけるパターン認識・学習理論の新展開)
- 画像認識におけるカーネル学習法(サーベイ(1))
- 特徴選択と Soft-Margin SVM の Boosting を用いた歩行者検出(学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 特徴選択と Soft-Margin SVM の Boosting を用いた歩行者検出(学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- カーネル学習法とその画像認識への応用(テーマ関連/オーガナイズドセッション(1))
- カーネル学習法とその画像認識への応用(オーガナイズドセッション(1))(CVのためのパターン認識・学習理論の新展開)
- 数値計算向きデータフロー計算機 (<小特集>関数型言語向きマシン)
- 科学技術計算用データ駆動計算機SIGMA-1のモンテカルロ法への適用(数値計算の基本アルゴリズムの研究)
- 仮想計算機によるLISPプログラムの動的特性
- 高級言語マシン
- LISPマシンとその評価
- 臨界投機実行のWWW情報検索への応用
- 実時間処理のためのネットワーク制御方式について (リスポンシブシステム実時間性と高信頼性の統合を目指して)
- 3. 実時間処理のためのハードウェアアーキテクチャ ( リアルタイムシステム)
- 実時間並列計算機CODAの命令セットの予備評価
- 実時間並列計算機CODA用ルータチップの予備的性能評価
- 実時間並列計算機CODAの命令セット・アーキテクチャ設計
- 実時間並列計算機CODAの構成とメンテナンスアーキテクチャ
- WPDRTS'99, RTSS'99と併設のワークショップRTMCS, RTCSA'99の参加報告
- 第5回実時間計算システムと応用国際会議(RTCSA'98)の参加報告
- パターン認識器の設計のための最適化(招待講演,文字・文書の認識と理解)
- 第4回実時間計算システムと応用国際会議(RTCSA'97)の参加報告
- センサフュージョンのための並列計算機システム
- サポートベクターマシンによる化学物質の発ガン性の予測
- H-001 HOGとSVMによる上半身検出器の特徴の抽出位置に関する考察(人物検出・移動検知,H分野:画像認識・メディア理解)
- サポートベクターマシンによる化学物質の発ガン性の予測