CUDAによるAES実装のための計算粒度最適化手法(高速化技術,FPGA応用及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
並列計算プラットフォームとしてGPGPUが注目されてり,CUDAがその開発環境として大きなシェアを占めるに至っている.CUDAではスレッド数やスレッドブロック数等のパラメータ決定はプログラマに責任があり,反復実験により最適値を求めているのが現状である.このため,我々は暗号処理のCUDA実装に対してスレッド数等を自動で最適化するモデルの構築を試みている.本稿では,その第一段階として,AESのCUDA実装に対し平文のデータ型,メモリ配置方法,計算粒度を変化させ,これらの条件がパフォーマンスに与える影響について分析を行った結果を示す.その結果,条件の違いにより最大6.6倍の性能差が生じ,(1)上限に近いスレッド数の確保よりもメモリアクセスの最適化を優先する実装が有効(2)16Byte/Threadの計算粒度は4Byte/Thread, 1Byte/Threadに対しGPUのパフォーマンスを引き出しやすい傾向にある,(3)平文のデータ型の違い,平文のメモリ配置方法,計算粒度がパフォーマンスに影響を与える,という知見が得られた.また,unsigned character及びarray of structureとして共有メモリに格納された平文に対して4Byte/Threadの計算粒度でのAES暗号化を行った場合にCPUの最大性能を引き出し,このときCore i7-920 2.66GHz CPU上での通常実装に対して約47倍の高速化が確認された.
- 2010-01-19
著者
-
西川 尚紀
防衛大学校情報工学科
-
岩井 啓輔
防衛大学校情報工学科
-
黒川 恭一
防衛大学校情報工学科
-
黒川 恭一
防衛大学校 情報工学科
-
黒川 恭一
防衛大学校
-
黒川 恭一
防衛大学校理工学研究科情報工学教室
-
岩井 啓輔
防衛大学校
-
岩井 啓輔
防衛大学校 情報工学科
関連論文
- 3D Unitary ESPRITにおける推定値ペアリング法の改良(アダプティブアンテナ,等化,干渉キャンセラ,MIMO,無線通信,一般)
- SASEBO-Rの電源ラインへの電磁波解析 (情報セキュリティ)
- SASEBO-Rの電源ラインへの電磁波解析 (情報処理)
- GPUの汎用計算環境CUDAによる暗号アルゴリズムに対するキークラックの高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 学生実験用電力解析攻撃システムの開発(VLSIシステム)
- 並列計算機ASCAの要素プロセッサによる近細粒度並列処理
- ソフトプロセッサコアを用いたH.264/AVCエンコーダのFPGA実装(アプリケーションII, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- サイドチャネル攻撃評価用自動測定ソフトウェアの開発
- 仮想ハードウェアWASMIIシステム用コンパイラの実装と評価
- アセンブリコードレベルの電力解析攻撃への対策 (ワイドバンドシステム)
- アセンブリコードレベルの電力解析攻撃への対策 (情報処理)
- A-7-19 SCAPEボードでの差分電力解析と差分電磁波解析の比較(A-7.情報セキュリティ,一般セッション)
- A-7-20 SASEBO-R上のAES回路に対する2種のCPAの比較(A-7.情報セキュリティ,一般セッション)
- DPA対策プリミティブゲートMRSLの提案
- CPA攻撃用実験環境の構築
- A-7-2 SASEBOボードへのCPA攻撃とその検証(A-7.情報セキュリティ,一般セッション)
- SASEBOボードに搭載されたAES回路へのサイドチャネル攻撃とその検証
- 5ZB-3 サイドチャネル攻撃標準評価ボード(SASEBO)を使ったAES暗号の実装攻撃実験(セキュリティ(5),学生セッション,セキュリティ)
- ハードウェア実装されたAES暗号のXOR演算部に対するDPA検証
- 2部グラフの最大マッチング問題の並列解法
- 1303 SSMによる後輪操舵型車両の軌道誘導(OS8 無人化・遠隔監視,次世代物流システム・建設機械,オーガナイズド・セッション)
- 集合被覆問題用ニューラルネットワーク
- 集合被覆問題用ニューラルネットワークとその論理設計への応用
- 集合被覆問題に対するニューラルネットワーク解法の提案
- C-12-7 H.264/AVCエンコーダのFPGAへの実装・評価(C-12.集積回路B(ディジタル),エレクトロニクス2)
- スケジューリングを考慮した多段結合網スイッチチップの実装
- スケジューリングを考慮した多段結合網スイッチチップの実装
- CUDAによるAES実装のための計算粒度最適化手法(高速化技術,FPGA応用及び一般)
- CUDAによるAES実装のための計算粒度最適化手法(高速化技術,FPGA応用及び一般)
- CUDAによるAES実装のための計算粒度最適化手法(高速化技術,FPGA応用及び一般)
- マルチグレイン並列処理を利用したソフトウェア制御キャッシュの開発
- マルチグレイン並列処理を利用したソフトウェア制御キャッシュの開発
- マルチグレイン並列処理を利用したソフトウェア制御キャッシュの開発
- マルチグレイン並列処理用マルチプロセッサシステム
- CPLDを用いたニューラルネットワークの開発
- SASEBO-Rの電源ラインへの電磁波解析(一般:情報通信基礎サブソサイエティ合同研究会)
- アセンブリコードレベルの電力解析攻撃への対策(一般:情報通信基礎サブソサイエティ合同研究会)
- SASEBO-Rの電源ラインへの電磁波解析(一般:情報通信基礎サブソサイエティ合同研究会)
- アセンブリコードレベルの電力解析攻撃への対策(一般:情報通信基礎サブソサイエティ合同研究会)
- SASEBO-Rの電源ラインへの電磁波解析(一般:情報通信基礎サブソサイエティ合同研究会)
- アセンブリコードレベルの電力解析攻撃への対策(一般:情報通信基礎サブソサイエティ合同研究会)
- FPGA実装されたストリーム暗号CryptMTの評価(セキュリティ応用,デザインガイア2009 VLSI設計の新しい大地)
- AESのS-BOX回路のDPA対策設計(リコンフィギャラブルシステム応用II,デザインガイア2006-VLSI設計の新しい大地を考える研究会)
- MRSLで構成したAESのS-BOX回路のDPA耐性検証
- データ駆動型仮想ハードウェアにおける自動ページ分割手法
- 仮想ハードウェアWASMIIシステム用コンパイラの実装と評価
- 仮想ハードウェアWASMIIシステム用コンパイラの実装と評価
- マクロタスク間におけるデータ転送方式の比較評価(コンピュータシステム)
- 近細粒度並列処理におけるレシーブレジスタ割当手法(コンピュータシステム)
- 階層型多段結合網R-Closにおける通信スケジューリング(コンピュータシステム)
- 階層型多段結合網R-Clos(計算機システム)
- 多段結合網R-Closにおける通信スケジューリング
- MAPLE用近細粒度並列化コンパイラ
- 多段結合網R-Closにおける通信スケジューリング
- MAPLE coreにおけるレシーブレジスタ割り当て手法
- 階層構造を持つ多段結合網R-Closの改良
- 多重バスをエミュレートする多段結合網R-Clos
- 組合せを利用する分類法を用いた相互情報量解析 (情報セキュリティ)
- L-010 GPGPUを用いた暗号攻撃(ネットワーク・セキュリティ,一般論文)
- MediaBenchにおけるマルチグレイン並列性の解析
- MediaBenchにおけるマルチグレイン並列性の解析
- コンパイラ主導型マルチプロセッサシステムASCAにおけるソフトウェア制御キャッシュシステムの実装
- コンパイラ主導型マルチプロセッサシステムASCAにおけるソフトウェア制御キャッシュシステムの実装
- マクロデータフロープリプロセッサの実装
- マクロデータフロープリプロセッサの実装
- 粗粒度並列化プリプロセッサの実装
- 粗粒度並列化プリプロセッサの実装
- 3ZE-6 相関値の変化傾向に着目した篩い分けのCPAへの適用(暗号実装・解析,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 3ZE-5 異なる実装方法による暗号モジュールに対する離散フーリエ変換を用いたCPAの適用(暗号実装・解析,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- L-020 AESに実装されたレジスタに対する相互情報量解析の適用(L分野:ネットワーク・セキュリティ,一般論文)
- C-036 モンゴメリ逆元算のFPGA化設計(C.アーキテクチャ・ハードウェア)
- L-040 ハードウェア実装されたXOR演算に対するDPA手法(L分野:ネットワーク・セキュリティ)
- M_052 DPA対策実験による電力解析評価プラットフォームの検証(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- C-014 Handel-Cによる暗号処理ボードSEBSW-2への暗号回路の実装・評価(C.アーキテクチャ・ハードウェア)
- C_004 Mersenne TwisterのIPコア化について(C分野:ハードウェア)
- L-011 SASEBO-Rを使用した電磁波解析と電力解析の比較(ネットワーク・セキュリティ,一般論文)
- L-009 AESの実装方法の違いによるCPAの比較(ネットワーク・セキュリティ,一般論文)
- AES暗号回路へのCPA攻撃の適用範囲に関する検証
- CUDA環境における共通鍵ブロック暗号の高速実装 (コンピュータシステム)
- アセンブリコードレベルの電力解析攻撃への対策
- L-021 対数モデルを用いた相関電力解析(L分野:ネットワーク・セキュリティ,一般論文)
- 動的部分再構成を利用した切替可能なAES S-box回路の評価(FPGA応用,FPGA応用及び一般)
- 対数モデルを用いたCPAに対するローパスフィルタの適用
- 組合せを利用する分類法を用いた相互情報量解析
- 動的部分再構成を利用した切替可能なAES S-box回路の評価(FPGA応用,FPGA応用及び一般)
- 動的部分再構成を利用した切替可能なAES S-box回路の評価(FPGA応用,FPGA応用及び一般)
- CUDA環境における共通鍵ブロック暗号の高速実装(アーキテクチャ,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討 (リコンフィギャラブルシステム)
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討 (コンピュータシステム)
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討 (VLSI設計技術)
- CUDA環境における共通鍵ブロック暗号の高速実装
- GPGPU実装されたブロック暗号のための性能モデルの提案 (コンピュータシステム・2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討(GPUとHPC,FPGA応用及び一般)
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討(GPUとHPC,FPGA応用及び一般)
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討(GPUとHPC,FPGA応用及び一般)
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討
- CUDA実装された共通鍵ブロック暗号のための性能予測モデルの検討
- マルチグレイン並列化コンパイラのメモリアクセスアナライザ
- GPGPU実装されたブロック暗号のための性能モデルの提案(GPGPU,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))