Cassandraによる局所性を考慮した分散並列処理の提案
スポンサーリンク
概要
- 論文の詳細を見る
近年,大量のデータを高速に処理することが必要な場面が増え,分散 KVS (Key Value Store) と呼ばれる NoSQL 型データベース管理システムが注目され始めた.分散 KVS に格納された大容量データを効率よく活用するには,データの並列処理が必要となるが,分散 KVS から対象データを取り出した後,再度データを分散させて並列処理を行うと,処理効率が悪くなってしまう.そこで本研究では,大規模データを扱う分散 KVS である Apache Cassandra に着目し,大規模データをより高速に処理するための手法を提案する. Cassandra に保存された値に対して任意の処理を行うには,値を取得し,その後処理を行うのが通常である.しかし, Cassandra の読み出し性能があまり高くない上に,取得する値のデータ量が大きくなると通信量が多くなり処理が遅くなることが予想される.そこで本研究では, Cassandra に保存された値に対し任意の処理を効率よく行えるようにするために,まず, UDF と類似した機能を Cassandra に追加する.この機能を利用し,各データノード上でユーザが指定した処理を行い結果のみをクライアントに返す手法を提案する.これにより通信データ量を抑えることができ,また,異なる複数の値に対して並列に処理を実行可能になり,より高速化できる.本稿では提案手法の実装の第一段階として, 1 つの値に対し,任意の処理を行い結果のみを取得する機能を実装し,その特性を評価した.その結果,本提案手法は処理対象の値のサイズが比較的大きい場合には有効であることが示せたと同時に,その一貫性レベルを調整することで処理の高速化が可能であることを確認した.
- 2012-12-05
著者
-
中田 秀基
産業技術総合研究所
-
竹房 あつ子
産業技術総合研究所
-
小口 正人
お茶の水女子大学理学部
-
中田 秀基
電子技術総合研究所
-
竹房 あつ子
お茶の水女子大学
-
竹房 あつ子
産業技術総合研究所情報技術研究部門
-
小口 正人
お茶の水女子大学理学部情報科学科
-
中田 秀基
電総研
-
小口 正人
お茶の水女子大学
-
中田 秀基
産業技術総合研
-
菱沼 直子
お茶の水女子大学
-
中田 秀基
独立行改法人産業技術総合研究所
関連論文
- 高品質分散実行環境のための計算・ネットワーク資源のグローバルスケジューリング手法(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ネットワーク帯域予約とOS仮想化機構を用いた分散アプリケーション実行環境に向けて(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 仮想計算機遠隔マイグレーションに対応するストレージ提供手法の比較検討(ストレージシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ポータビリティの高いジョブスケジューリングシステム設計と実装(HPC-10 : ネットワークとスケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- グリッドにおける計算資源と光パスネットワーク資源のコアロケーション実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- グリッドにおける計算資源と光パスネットワーク資源のコアロケーション実験(グリッド, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 複数拠点にまたがるe-Scienceアプリケーション環境構築を目的としたソフトウェア導入・管理機構(並列・分散システム,システム開発論文)
- NAREGIミドルウェアβ-gLite間における相互ジョブ起動実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム
- レプリカ交換分子動力学シミュレータREMD Toolkitのグリッド上での実行(HPC-3 : 科学技術計算)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- WSRFに基づく情報サービスのXACMLによるアクセス制御(HPC-17 : グリッド)
- ORE Grid : 仮想計算機を用いたグリッド実行環境の高速な配置ツール(グリッド)
- カスタマイズ可能な仮想計算機上におけるグリッドでのジョブ実行(仮想計算機とクラスタ技術, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- ステートレス仮想クラスタの構想(クラスタと省電力技術)
- 仮想クラスタ管理システムの設計と実装(仮想化)
- Rocksを用いた仮想クラスタ構築システム(並列処理システム)
- オーバーレイスケジューラJojo3のグリッドRPCへの適用(HPC-6:グリッド,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- オーバレイスケジューラJojo3の提案(Grid,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- Jojoによる遺伝的プログラミングの並列化(グリッド応用)
- Javaによる階層型グリッド環境Jojoの設計と実装(グリッド基盤ソフト)
- グリッド向け実行環境Jojoを用いた遺伝的アルゴリズムによる蛋白質構造決定
- グリッド環境に適したJava用階層型実行環境Jojoの設計と実装(高性能計算及び一般)
- 仮想クラスタ遠隔ライブマイグレーションにおけるストレージアクセス最適化機構(HPC-2:仮想クラスタ,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 1.SlothLib/EaRDB : マイサーチエンジン開発環境支援(パートII:情報分野研究者のためのオンリーワン共有イノベーションプラットフォーム,情報爆発時代におけるわくわくするITの創出を目指して)
- Ninf-G2の性能評価 : 科学技術計算における事例(HPC-2 : グリッド(1))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 動的ネットワークパスプロビジョニングの相互運用技術 : G-lambdaシステムとGLIF Feniusの連携(ネットワーク管理/制御/設計)
- 複数ドメイン環境でQoSを保証するクラウドのための資源管理フレームワーク(クラウド、グリッド・P2P)
- ネットワーク帯域予約を用いた分散アプリケーション実行環境の構築(クラウド、グリッド・P2P)
- OGSAアーキテクチャに基づくNAREGIスーパースケジューラの設計と実装(グリッド)
- グリッド環境におけるスーパースケジューラ連携手法の検討(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- グリッド環境におけるスーパースケジューラ連携手法の検討
- Speculativeチェックポインティングの設計と実装(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 仮想計算機と仮想ネットワークを用いた仮想クラスタの構築
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(ジョブスケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模環境向け情報共有手法を用いた分散ジョブスケジューリングシステム(ジョブスケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 光ネットワーク環境におけるMPI集団通信(分散共有メモリと通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- グリッド上における仮想計算機を用いたジョブ実行環境構築システムの高速化(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模環境向け情報共有手法を用いた分散ジョブスケジューリングシステム(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 光ネットワーク環境におけるMPI集団通信(分散共有メモリと通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- グリッド上における仮想計算機を用いたジョブ実行環境構築システムの高速化(グリッド, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(応用システム, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- 仮想計算機を用いて負荷分散を行うMPI実行環境(仮想計算機とクラスタ技術, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- ユーザのステアリングを許すインタラクティブなジョブスケジューリングシステム(グリッド)
- 非対称ネットワークを隠蔽する高速通信インフラストラクチャの設計と実装(グリッド(2), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- グリッド環境におけるモニタリングシステムの自律的構成(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 非対称ネットワークを隠蔽する高速通信インフラストラクチャの設計と実装
- グリッド環境におけるモニタリングシステムの自律的構成
- 耐故障性を重視したRPCシステムNinf-Cの設計と実装(グリッド)
- グリッド上のスケーラブルな並列レプリケーションフレームワーク(HPC-11 : グリッド(3))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- グリッド技術を用いた進化系統樹推定の並列化(グリッド応用)
- Condorの汎用グリッドインターフェイスの設計とUNICOREへの適用(グリッド基盤システム)
- グリッド環境におけるVM上でのジョブ実行の検討(グリッド基盤システム)
- GridRPCを用いたタスクファーミングAPIの試作(グリッド)
- 次世代グリッド基盤OGSAにおけるC言語動作環境提供システムの試作と評価(HPC-11 : グリッド(2))(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- アプリケーションのインストール、データの配布、更新をサポートするグリッドポータル構築ツールキット(PCT4G)の開発(HPC-11 : グリッド(2))(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- グリッドコンピューティングにおけるモニタリングシステムの自律的構成(HPC-6 : ジョブスケジューリング)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- Gridポータル構築ツールキット Ninf-Portal
- Webサービス技術を基盤とするGridRPCシステムの評価
- グリッド環境におけるクラスタ間データ転送の評価
- Grid環境に適した並列組み合わせ最適化システムの提案
- Grid RPCシステムのAPIの提案
- Grid環境におけるモニタリング手法の評価
- Ninfシステムにおけるフォールトトレランス
- ミドルウェア連携による計算・ネットワーク資源の日米間グリッドコアロケーション実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 事前予約機構のポリシ記述による制御(グリッドと数値計算)
- グローバルスケジューリングのためのローカル計算資源管理機構
- 事前予約機能を持つローカルスケジューリングシステムの設計と実装(ジョブスケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 2.Googleのクラウド技術(クラウドの事例紹介,クラウドコンピューティング)
- オーバレイスケジューラJojo3の提案(Grid,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 既存VMMへの適用が容易でゲスト透過なポストコピー型仮想マシン再配置機構
- 高速マイグレーションを利用した仮想マシン配置最適化システムの検討
- 高速フラッシュメモリに適したキーバリューストアの予備的評価
- 性能を保証する分散実行環境のためのオンラインコアロケーション手法
- クラウドコンピューティングの性能評価
- クラウドコンピューティングの性能評価
- 高速フラッシュメモリ向けMapReduceフレームワークの実現に向けて
- GlobusによるGrid RPCシステムの実装と評価
- 資源予約と連携した階層型分散資源モニタリングシステムの設計(クラスタとグリッド技術)
- 経路が動的に接続/解放されるネットワークにおけるユーザ単位の経路切替手法(HPC-15 : ネットワーク)
- ネットワーク帯域予約とOS仮想化機構を用いた分散アプリケーション実行環境に向けて(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 仮想計算機パッキングへの最適化手法の適用(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- ミドルウェア連携による計算・ネットワーク資源の日米間グリッドコアロケーション実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 仮想計算機メモリの遅延再配置による高速ライブマイグレーション
- 仮想計算機遠隔ライブマイグレーションのための透過的なストレージ再配置機構
- 仮想計算機遠隔マイグレーションに対応するストレージ提供手法の比較検討(ストレージシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 瞬間的な実行ホスト切り替えを可能とする仮想マシンの高速ライブマイグレーション機構 (インターネットコンファレンス2009論文集)
- 仮想クラスタ遠隔ライブマイグレーションにむけた仮想計算機ストレージの透過的再配置機構の評価(クラスタとグリッド技術)
- 仮想クラスタのステートレス化のためのRocks5ディスクレス化機構(HPC-2:仮想クラスタ,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- グリッドRPCシステムのクラウド環境への適用
- WSRFに基づく情報サービスのXACMLによるアクセス制御
- 仮想計算機遠隔マイグレーションに対応するストレージ提供手法の比較検討 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 複数サイトにまたがる仮想クラスタの構築(HPC-14 : 分散処理)
- 高速マイグレーションを利用した仮想マシン配置最適化システムの検討
- 大規模資源の管理・制御に関する技術の実証実験 : 新世代ネットワークプラットフォームの実現に向けて(ネットワーク品質,トラヒック計測,サービス品質,一般)
- 仮想クラスタに対するIPストレージの提供方法の比較(仮想クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 仮想クラスタに対するIPストレージの提供方法の比較(仮想クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 性能を保証する計算・ネットワーク資源のコアロケーション手法の評価
- 高品質分散実行環境のための計算・ネットワーク資源のグローバルスケジューリング手法(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))