Cassandraによる局所性を考慮した分散並列処理の提案(ビッグデータ,ビッグデータとソーシャルコンピューティング,及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
近年,大量のデータを高速に処理することが必要な場面が増え,分散KVS(KeyValueStore)と呼ばれるNoSQL型データベース管理システムが注目され始めた.分散KVSに格納された大容量データを効率よく活用するには,データの並列処理が必要となるが,分散KVSから対象データを取り出した後,再度データを分散させて並列処理を行うと,処理効率が悪くなってしまう.そこで本研究では,大規模データを扱う分散KVSであるApacheCassandraに着目し,大規模データをより高速に処理するための手法を提案する.Cassandraに保存された値に対して任意の処理を行うには,値を取得し,その後処理を行うのが通常である.しかし,Cassandraの読み出し性能があまり高くない上に,取得する値のデータ量が大きくなると通信量が多くなり処理が遅くなることが予想される.そこで本研究では,Cassandraに保存された値に対し任意の処理を効率よく行えるようにするために,まず,UDFと類似した機能をCassandraに追加する.この機能を利用し,各データノード上でユーザが指定した処理を行い結果のみをクライアントに返す手法を提案する.これにより通信データ量を抑えることができ,また,異なる複数の値に対して並列に処理を実行可能になり,より高速化できる。本稿では提案手法の実装の第一段階として,1つの値に対し,任意の処理を行い結果のみを取得する機能を実装し,その特性を評価した.その結果,本提案手法は処理対象の値のサイズが比較的大きい場合には有効であることが示せたと同時に,その一貫性レベルを調整することで処理の高速化が可能であることを確認した。
- 2012-12-05
著者
-
竹房 あつ子
産業技術総合研究所
-
竹房 あつ子
お茶の水女子大学
-
小口 正人
お茶の水女子大学理学部情報科学科
-
中田 秀基
電総研
-
小口 正人
お茶の水女子大学
-
中田 秀基
産業技術総合研
-
菱沼 直子
お茶の水女子大学
関連論文
- 仮想マシンPCクラスタにおける並列データ処理アプリケーション実行時のストレージアクセスに関する一検討(ストレージアクセス技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- iSCSI遠隔ストレージアクセスにおけるVPN経路接続を用いた場合の性能に与える影響の評価(ストレージアクセス技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- メタバースサービスにおける高負荷時のレスポンスに関する検討(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 高品質分散実行環境のための計算・ネットワーク資源のグローバルスケジューリング手法(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ネットワーク帯域予約とOS仮想化機構を用いた分散アプリケーション実行環境に向けて(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- iSCSIリモートストレージアクセスの性能向上を実現する手法の提案と実装(ネットワーク,クラウド及び一般)
- 輻輳ウィンドウ及びパケット解析を用いたiSCSI遠隔ストレージアクセスの評価(遠隔データアクセス,ネットワーク技術及び一般)
- グリッドにおける計算資源と光パスネットワーク資源のコアロケーション実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- グリッドにおける計算資源と光パスネットワーク資源のコアロケーション実験(グリッド, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- WSRFに基づく情報サービスのXACMLによるアクセス制御(HPC-17 : グリッド)
- iSCSIストレージアクセスにおけるTCPふくそうウインドウコントロール手法の提案と性能評価(ストレージ技術,データ工学論文)
- グリッドアプリケーションのためのGMPLSネットワーク資源の管理制御(MPλ(Lambda)S,フォトニックネットワーク/制御,光波長変換,スイッチング,PON,一般)
- 動的ネットワークパスプロビジョニングの相互運用技術 : G-lambdaシステムとGLIF Feniusの連携(ネットワーク管理/制御/設計)
- 複数ドメイン環境でQoSを保証するクラウドのための資源管理フレームワーク(クラウド、グリッド・P2P)
- ネットワーク帯域予約を用いた分散アプリケーション実行環境の構築(クラウド、グリッド・P2P)
- グリッド環境におけるスーパースケジューラ連携手法の検討(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- グリッド環境におけるスーパースケジューラ連携手法の検討
- グリッド計算環境でのデッドラインを考慮したスケジューリング手法の性能(計算機システム)
- Grid Datafarmにおけるスケジューリング・複製手法の性能評価(グリッド基盤ソフト)
- Grid Datafarmにおけるスケジューリング・複製手法の性能評価
- グローバルコンピューティングのスケジューリングのための性能評価システム(並列処理)
- グローバルコンピューティングのためのスケジューリングフレームワーク(並列処理)
- グローバルコンピューティングシステムのシミュレーションによる評価 (並列処理)
- グローバルコンピューティングシミュレータの概要
- Ninfシステムにおけるジョブスケジューラの実装と予備的評価
- 複数クライアントによるLAN/WANでのNinfの性能(並列処理)
- 高性能広域計算システムNinfのスケジューリングに関する予備的考察
- ネットワーク数値情報システムNinf : マルチクライアント環境での性能
- マルチホップネットワークにおける汎用OSを用いたセキュリティ機構の応答性制御方式(ネットワークセキュリティ,ネットワーク技術及び一般)
- ミドルウェア連携による計算・ネットワーク資源の日米間グリッドコアロケーション実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- B-6-17 グリッドアプリケーションのためのGMPLSネットワーク資源の管理制御(B-6.ネットワークシステム,一般講演)
- 事前予約機構のポリシ記述による制御(グリッドと数値計算)
- グローバルスケジューリングのためのローカル計算資源管理機構
- 事前予約機能を持つローカルスケジューリングシステムの設計と実装(ジョブスケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 仮想マシンマイグレーションによるストレージアクセス最適化に関する性能評価(ネットワーク,クラウド及び一般)
- 6ZA-7 ユビキタスデータ処理VPN環境の構築手法に関する検討(マルチメディア通信,学生セッション,ネットワーク)
- 1S-6 PLC/無線LAN経由P2P通信におけるトラフィック特性の性能評価(P2Pデータ処理,学生セッション,データベースとメディア)
- 2ZK-1 マルチコア・仮想マシン環境におけるIP-SANアクセスの性能評価(情報爆発時代におけるコンテンツ格納手段,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- L_077 無線LAN通信時におけるTCPパラメータの振舞とパケット転送タイミングの解析(L分野:ネットワークコンピューティング)
- Android端末の無線LAN通信時のトランスポート層の振舞に関する一検討
- 性能を保証する分散実行環境のためのオンラインコアロケーション手法
- データインテンシブアプリケーション実行時におけるクラウドリソースへの負荷分散ミドルウェア
- データインテンシブアプリケーション実行時におけるクラウドリソースへの負荷分散ミドルウェア
- IEEE802.11無線LANにおける帯域公平性の問題の検討
- 資源予約と連携した階層型分散資源モニタリングシステムの設計(クラスタとグリッド技術)
- 経路が動的に接続/解放されるネットワークにおけるユーザ単位の経路切替手法(HPC-15 : ネットワーク)
- 広域分散ファイルシステムにおける遠隔データアクセスに関する一考察
- データインテンシブアプリケーション実行時におけるクラウドリソースへの負荷分散ミドルウェア
- 3Z-7 マルチホップネットワークにおける応答時間を考慮したセキュリティ実現方式の一検討(ネットワークセキュリティ,学生セッション,ネットワーク)
- ネットワーク帯域予約とOS仮想化機構を用いた分散アプリケーション実行環境に向けて(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 分散型メタバースサーバのログインタイム短縮に関する一検討
- データ処理アプリケーションのクラウドリソースとローカルクラスタ間における負荷分散ミドルウェアの検討(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 仮想計算機パッキングへの最適化手法の適用(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- ミドルウェア連携による計算・ネットワーク資源の日米間グリッドコアロケーション実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 異なるパラメータにおけるアプリケーションの無線LAN上におけるトラヒック解析(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- iSCSIストレージの各層最適化時のVPN遠隔接続環境における性能向上の検討(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 分散型メタバースサーバにおけるサービス提供時の動作解析(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- WSRFに基づく情報サービスのXACMLによるアクセス制御
- 複数インタフェースを用いた無線通信のコネクション集約ミドルウェア
- iSCSI遠隔ストレージアクセスにおけるパケット送信処理のカーネルモニタを用いた動作解析
- 6ZA-1 無線通信環境におけるQoS保証TCPの動作に関する一検討(マルチメディア通信,学生セッション,ネットワーク)
- 1ZP-5 Androidの無線LAN通信性能に関する一検討(情報爆発時代におけるネットワーク技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 移動端末におけるQoS保証TCPの特性評価(ネットワーク品質,トラヒック計測,一般)
- 複数無線インタフェース使用時のミドルウェアにおけるバッファ量の評価(ネットワーク品質,トラヒック計測,サービス品質,一般)
- 大規模資源の管理・制御に関する技術の実証実験 : 新世代ネットワークプラットフォームの実現に向けて(ネットワーク品質,トラヒック計測,サービス品質,一般)
- 超高精細映像配信サービスのためのストレージ・ネットワーク統合資源管理方式の提案(ブロードバンドアクセス,ホームネットワーク,ネットワークサービス,通信利用アプリケーション,一般)
- VPN上のiSCSI環境における複数経路アクセス適応制御手法の提案と評価
- 1ZP-1 複数無線インタフェース使用時のネットワーク層におけるコネクション集約に関する評価(情報爆発時代におけるネットワーク技術,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 性能を保証する計算・ネットワーク資源のコアロケーション手法の評価
- 高品質分散実行環境のための計算・ネットワーク資源のグローバルスケジューリング手法(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 5ZP-3 分散ファイルシステムHadoopの広域環境への適用(情報爆発時代におけるストレージ管理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- グローバルコンピューティングシミュレータの概要
- PluS予約機構のCondorへの適用(通信とグリッドII)
- グローバルスケジューリングのための計算資源予約管理機構(グリッド)
- 事前予約機能を持つローカルスケジューリングシステムの設計と実装(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 2ZK-6 MANETにおけるモバイルDBデータ高度処理のためのフレームワークの提案およびミドルウェア実装(情報爆発時代におけるコンテンツ格納手段,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Globus Toolkit 4におけるWSRFサービス記述のアノテーションによる補助(HPC-17 : グリッド)
- マルチドメインクラウド資源管理フレームワークの実証実験 (ネットワークシステム)
- 動的ネットワークパスプロビジョニングの相互運用技術 : G-lambdaシステムとGLIF Feniusの連携(ネットワーク管理/制御/設計)
- 多種資源を対象とするオンラインコアロケーション手法の提案
- Condor VM ユニバースを利用した HPC Cloud の試作
- 省電力化にむけた仮想計算機パッキングアルゴリズムの提案 (コンピュータシステム)
- マルチドメインクラウド資源管理フレームワークの実証実験(クラウド)
- グローバルコンピューティングシミュレータの概要
- マルチドメインクラウド資源管理フレームワーク (スマートな社会を支えるインターネットアーキテクチャ論文特集)
- マルチドメインクラウド資源管理フレームワーク(スマートな社会を支えるインターネットアーキテクチャ論文)
- 省電力化にむけた仮想計算機パッキングアルゴリズムの提案(仮想マシン,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- NSI相互運用試験のためのGridARSによるネットワーク資源管理 (ネットワークシステム)
- ポストペタスケール計算機環境に向けた高可用分散協調セルフスケジューリング機構の提案
- 省電力化のためのマッチングに基づく仮想計算機パッキングアルゴリズム
- Cassandraによる局所性を考慮した分散並列処理の提案
- 1-D-3 消費電力削減のための仮想計算機パッキング問題に対する解法(節電)
- Cassandraによる局所性を考慮した分散並列処理の提案 (データ工学)
- インタークラウドにおける仮想インフラ構築システムの提案
- NSI相互運用試験のためのGridARSによるネットワーク資源管理(網監視・運用)
- パーシステントストレージを利用した高可用分散協調スケジューラの実装
- ポストペタスケール高性能計算のためのオンメモリストレージの設計
- グリッド環境におけるスーパースケジューラ連携手法の検討(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- Cassandraによる局所性を考慮した分散並列処理の提案(ビッグデータ,ビッグデータとソーシャルコンピューティング,及び一般)
- NSI相互運用試験のためのGridARSによるネットワーク資源管理