DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
スポンサーリンク
概要
- 論文の詳細を見る
Cell Broadband Engine(Cell/B.E.)のようにキャッシュを持たない単純なCPUコアを多数内蔵するマルチコアCPUが注目されている.このようなCPUコアではキャッシュの代わりに小容量のローカルメモリを持ち,主記憶とローカルメモリの間をDMA転送によりデータ転送することでキャッシュの代用をさせる.上記のアーキテクチャによるチップ内演算能力の向上とは裏腹に,これに見合ったデータ供給能力の実現が実効性能の鍵を握る.本報告では,DIMMnet-2と同様の連続化ハードウェアによるDMAで主記憶をアクセスするCPUへの不連続アクセスの連続化の効果について,主記憶データベースに対するWisconsinベンチマークを用いた性能評価に基づいて論じる.
- 一般社団法人情報処理学会の論文
- 2008-03-05
著者
-
太田 淳
東京農工大学
-
金 美善
東京農工大学
-
田邊 昇
(株)東芝研究開発センター
-
中條 拓伯
東京農工大学
-
田邊 昇
株式会社東芝
-
田邊 昇
(株)東芝
-
田邊 昇
株式会社 東芝
-
中條 拓伯
東京農工大
関連論文
- 大容量データ向け対話的実時間遠隔可視化装置の実現性検討(ストレージと可視化,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの予備評価(高性能計算とアクセラレータ)
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- スケーラブルFPGAシステムにおけるハードウェア拡張方式 (リコンフィギャラブルシステム)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション (コンピュータシステム)
- 経験的モード分解を用いた雑音環境下における警笛抽出手法 (産業計測制御研究会 モーションコントロール、センサ応用、信号処理応用、生体信号処理など)
- base-m n-cubeの実現方式に関するシミュレーション
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- DIMMnet-3ネットワークインタフェースにおけるMPI支援機能(ARC-6:相互結合網,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- DIMMnet-2ネットワークインタフェースコントローラの設計と実装(HPCハードウェア)
- DIMMスロット装着型デバイスDIMMnet-2の改良方針(ARC-7: ネットワークインタフェースとルーティング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- RC-005 DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(ハードウェア・アーキテクチャ,査読付き論文)
- 経験的モード分解を用いた雑音環境下における警笛抽出手法
- DIMMnet通信インタフェース用パケット伝送レイヤ
- bDais : DIMMnet-1/InfiniBand間ルータの評価(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- コモディティOSとメモリマップによるクラスタシステムの実装
- DIMMnet-2 NICのTCP/IPプロトコルスタック用ネットワークドライバの実装と評価
- DIMMnet-2用Windowsドライバの実装と評価
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMスロット搭載型ネットワークインタフェースDIMMnetにおけるスレッドライブラリ(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- DIMMスロット搭載型ネットワークインタフェースDIMMnetにおけるスレッドライブラリ
- SMTプロセッサにおけるスレッドスケジューラの開発(マルチスレッド)
- SMTプロセッサにおける再構成可能キャッシュモデルとFPGAによる実装
- FPGAを用いたSMTプロセッサの実現と再構成可能キャッシュメモリの検討(設計手法と高性能化, リコンフィギャラブルシステム, 一般)
- SMTプロセッサにおける同期方式の検討(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- SMTプロセッサにおける同期方式の検討
- SMTプロセッサにおける細粒度最適化手法の検討(ARC-3 : プロセッサアーキテクチャIII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- SMTプロセッサにおける物理レジスタバンクの動的割当て
- SMTプロセッサにおけるスレッドスケジューラの開発(スレッド・プロセス)
- マルチスレッドアーキテクチャ向けOS「Future」におけるプロセス管理
- マルチスレッドアーキテクチャにおけるスレッドライブラリの実装と評価(プロセッサアーキテクチャ)
- SMTプロセッサにおけるアウトオブオーダ実行に必要なリソースの共有方式の評価(ARC-1:プロセッサ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- スレッド管理機構を用いたオンチップマルチスレッドのためのキャッシュメモリシステム
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- マルチスレッドアーキテクチャOChiMuS PE向けシステムソフトウェアにおけるスレッド固有メモリの管理方式(システムプログラム)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の通信性能評価
- Cell/B.E.とDIMMnetを併用した大容量ボリュームレンダリングの並列処理性能(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- DIMMnet-2ネットワークインタフェースボードの試作(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- Gather機能付き拡張メモリのアクセス性能の評価
- Gather機能付き拡張メモリのアクセス性能の評価
- キャッシュを用いたレジスタ・マップ表の回路面積削減
- 選択的キャッシュ・アロケーション:マルチスレッド環境におけるキャッシュ利用効率の向上手法
- メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ベクトルアクセス機構を有するメモリモジュールによる不連続なDMAの効率化
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- ハードウェアを用いたメッセージ交換システムのスケーラビリティ改善(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- MPI派生データ型通信支援機構のDIMMnet-2への実装と評価(ネットワーク)
- メモリスロット直結型ネットワークインタフェースへのマルチキャストの実装と評価
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 主記憶以外に大容量メモリを有するメモリ/ネットワークアーキテクチャ(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ハードウエアによるMPI派生データ型通信の支援(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化(通信アーキテクチャ)
- DIMMnet-2を用いた間接メモリアクセスの高速化
- メッセージパッシングモデルを支援するパケット受信機構のDIMMnet-2への実装と評価(ネットワーク)
- メッセージパッシングモデルを支援するパケット受信機構の実装(一般セッションC 設計と実装)
- DIMMnet-2ネットワークインタフェースにおけるプリフェッチ機構の実装と評価
- メモリモジュール上での等間隔アクセス連続化の効果(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- メモリモジュール上での等間隔アクセス連続化の効果
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア拡張方式(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- スケーラブルFPGAシステムにおけるハードウェア・アクセラレーション(高速化技術,FPGA応用及び一般)
- DMAで主記憶をアクセスするCPUにおける不連続アクセスの連続化(メモリアクセス,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- SMTプロセッサにおけるL1/L2キャッシュアクセス動的切替え方式
- SMTプロセッサにおけるキャッシュリプレース動的切替え方式(プロセッサアーキテクチャ)
- 携帯機器を用いた高密度ネットワークによる並列分散処理
- SMTプロセッサにおけるキャッシュメモリリプレース方式の動的切り替え(SMTプロセッサと専用ハードウェア)
- SMTプロセッサ向けキャッシュメモリリプレース方式(プロセッサアーキテクチャ)
- マルチスレッドプロセッサにおける再構成可能キャッシュメモリ
- FPGAにおけるSMTプロセッサの実装モデル
- SMTプロセッサ向けの軽量な同期機構(プロセッサアーキテクチャ)
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- 並列/分散処理環境における組込み仮想マシンの実現可能性(組込みシステムプラットフォーム)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の試作
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその低遅延通信機構AOTF(高性能アーキテクチャ)
- DIMMnet-1におけるMartiniオンチッププロセッサによる通信の性能評価
- DIMMnet-1プロトタイプによるバンド幅と大域演算性能の評価
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1とその高バンド幅通信機構BOTF(並列処理)
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- B-003 NAS CGベンチマークによるプリフェッチ機能付きメモリモジュールの性能評価(B.ソフトウェア)
- メモリスロットインタフェースの得失(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- プリフェッチ機能付きメモリモジュールによる不連続アクセスの連続化(高速化手法)
- プリフェッチ機能を有するメモリモジュール(ARC-8:メモリシステム)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- メモリスロット装着型ネットワークインタフェースDIMMnet-2の構想
- DIMMnetネットワーク接続動作検証環境
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- A-11 高速通信インタフェースDIMMnet-1での並列アプリケーションによる評価(PCクラスタ,A.アルゴリズム・基礎)
- A-10 高速通信インタフェースDIMMnet-1の通信バンド幅評価(PCクラスタ,A.アルゴリズム・基礎)
- メモリスロットに塔載されるNICのクラスタ性能予測
- 高性能クラスタ構築用ハードウェアの現状と展望(ハードウェアとOS,SANを用いた高性能コンピュータシステム,及び一般)
- 超並列テラフロップスマシンTS/1の構想
- AndroidにおけるJavaアプリケーションのFPGAアクセラレーション