MapReduceを用いた木構造データのための並列分析処理フレームワーク
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,木構造データを分析処理するためのフレームワークを提案する.提案するフレームワークでは,垂直分割データ格納方式により木構造データを管理する.即ち,木構造データを属性ごとに分割し,別々のファイルにデータを保存する.これにより属性の数が多い木構造データを扱うことが可能となる.また大規模のデータに対し分析処理を実行可能とするため,MapReduce アーキテクチャに基づく並列処理を行う.評価実験により,属性の追加や属性値の集計のような典型的な分析処理に対して,提案するフレームワークが有用であることを示す.
- 2010-07-28
著者
関連論文
- MapReduce を用いた木構造データのための並列分析処理フレームワーク
- MapReduceを用いた木構造データのための並列分析処理フレームワーク
- MapReduceを用いた木構造データのための並列分析処理フレームワーク
- 企業における非定形文書の活用促進事例 : 営業日報へのテキスト分析技術の適用(自然言語処理技術による情報マネジメントの実際)(自然言語処理の高度化による知的生産性の向上)
- M-006 文書クラスタリングを用いたコミュニティ抽出(M分野:ユビキタス・モバイルコンピューティング)
- E-035 共起漢字ベクトルを用いた同義語抽出方式(E.自然言語・文書・ゲーム)
- 慣用句抽出のための統計尺度の比較評価(語彙的知識獲得)
- テキストコーパスからのトピック階層の抽出(自然言語)(コラボレーションアートとネットワークエンターテイメント)
- I-82 WWW有害情報のフィルタリングのための画像判別手法(画像レイアウト解析,I.画像認識・メディア理解)
- コーパス対応の関連シソーラスナビゲーション
- D-038 技術文書からの数値属性の抽出(D分野:データベース,一般論文)
- 松本裕治, 今井邦彦, 田窪行則, 橋田浩一, 郡司隆男:言語の科学入門, 岩波書店(1997)
- 非構造化データ利活用のためのメディア処理技術(ビッグデータとAI)
- RD-002 多重仮説文書構造ネットワークを用いたデータ抽出方式の開発(D分野:データベース)