正規表現マッチングの並列化とそのHadoopでの評価
スポンサーリンク
概要
- 論文の詳細を見る
正規表現は広く用いられており,文章が正規表現にマッチするかどうかの問合せ (クエリ) を効率的に実行することは重要である.これまで,正規表現マッチングを高速に行う逐次的な手法について多くの研究がある.正規表現マッチングを並列に行う方法についても研究があるが,その多くは,複数の文章に対するクエリの並列実行や,複数のクエリの並列実行というような自明な並列実行について扱うものである.一方で,巨大な 1 つの文章に対して 1 つのクエリを行う場合には,正規表現マッチングそのものを並列化する必要が発生する.本稿では,正規表現マッチングを並列化する手法について議論を行う.また,本稿で提案する正規表現の並列マッチングの計算効率を評価するため,Hadoop を用いて実験を行いその結果を報告する.Hadoop は,大規模分散データに対して効率的に処理を行うことができる MapReduce フレームワークのオープンソース実装である.
- 2011-09-22
著者
関連論文
- 1.マルチコア計算機と基本的な並列化技法(マルチコアを活かすお手軽並列プログラミング)
- 2.GCC上での並列プログラミングサポート(マルチコアを活かすお手軽並列プログラミング)
- 並列プログラムの候補生成と適合性検査による並列化
- Generator-of-generators に基づく Fortress ライブラリ
- リスト上の最大マーク付け問題を解く並列プログラムの導出
- 木スケルトンによるXPathクエリの並列化とその評価
- 有理式で表わされる不確かさをもつ制御系の解析・設計法
- 最適化機構を持つC++並列スケルトンライブラリ(サイバー増大ページ論文概要,サイバー増大号)
- 正規表現マッチングの並列化とそのHadoopでの評価
- 領域限定言語に基づく最適経路問合せ
- 大貧民において不完全情報性がモンテカルロ法によるプレイヤに与える影響の調査
- 大貧民において他プレイヤのプレイアルゴリズムより受けるプレイヤの強さへの影響
- boost::protoを用いた融合変換機能付きライブラリの作成
- 木上のスケルトン並列プログラミングのための演算子生成器