頻出部分文字列のマイニング(抽出, マイニング)(言語理解とコミュニケーション)
スポンサーリンク
概要
- 論文の詳細を見る
可変長Nグラムのカウントを頻出パターンマイニング問題の文脈で捉え直し、ある閾値以上出現するすべての部分文字列を列挙する問題として定義する。また、この問題を高速かつ少ないメモリで解くアルゴリズムを提案する。計算機実験により、接尾辞木を使用する方法に比べて高速であることが確かめられた。
- 社団法人電子情報通信学会の論文
- 2003-10-31
著者
関連論文
- 現場発想による自然言語処理ブレークスルーの探求(平成21年度論文賞の受賞論文紹介)
- 部分的かつ曖昧なラベル付き構造データからのマルコフ条件付確率場の学習(情報抽出・ラベル付与)
- カーネル法に基づく構造データのラベル付け学習アルゴリズム(「自動推論:帰納,演繹,モデル検査/生成,学習,発見,仮説推論、論理プログラム,プランニングetc.」及び一般)
- 現場発想による自然言語処理ブレークスルーの探求
- 日本語単語分割の分野適応のための部分的アノテーションを用いた条件付き確率場の学習
- 系列パターンマイニングによる対訳表現抽出
- テキストデータベースからの構文構造のマイニング
- 言語情報を利用したテキストマイニング
- テキストデータベースからの構文構造のマイニング (テーマ:「アクティブマイニング」および一般)
- 頻出部分文字列のマイニング(抽出,マイニング)
- 頻出部分文字列のマイニング(抽出, マイニング)(言語理解とコミュニケーション)
- 頻出部分文字列のマイニング
- 異なるタイプのドキュメントに対する著者推定
- 点予測による自動単語分割
- 点予測による自動単語分割
- Learning from Crowds and Experts