大規模データベースからの頻出構造化パターンの抽出
スポンサーリンク
概要
- 論文の詳細を見る
大規模なデータベースから構造化された相関パターンを発見するというデータマイニングの問題を取り上げる.構造化された相関パターンというのは,アイテムの集合の集合である.これは,対象データ中に存在する特定の集合における2段階の構造を表現することができる.抽出される構造そのものは,非常に簡単であるが,しかし,従来のパターン発見アルゴリズムでは抽出することはできない.本論文では,すべての頻出する構造化相関パターンを発見するアルゴリズムを示す.この構造化相関パターンの抽出問題は,テキストマイニングのあるアプリケーションに対するソリューションとして取り組んだ問題である.人工データおよび実データに対して実験を行い,本論文のアルゴリズムが大規模データに対して効率良く構造化相関パターンを抽出することを確認した.
- 一般社団法人情報処理学会の論文
- 2001-07-15
著者
関連論文
- 教師付き学習を用いた教師なし変化解析手法(知識獲得,機械学習,情報爆発論文)
- 断面情報を用いた図面からの形状復元手法
- OrtoSolid : 非多様体位相を用いた立体モデルの生成法
- 三面図上の寸法・属性情報の3次元変換
- 断面図からのソリッドモデルの合成
- 2次元図面からのソリッドモデル合成システム : 2次元パターンの利用とかくれ線の省略
- 7-a) ポストゲノム時代のテキストマイニングミドルウェア(企業におけるバイオNLPへの取り組み)(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 大規模生物医学文献データベースのテキストマイニング・ツール (テキストマイニング(Part2))
- ライフサイエンス向けテキストマイニングツールMedTAKMI(テキストマイニングの応用(2))
- ライフサイエンス分野におけるテキストマイニング技術適用の動向(テキストマイニングの応用(2))
- 文献データベースからの生医学インフォマティクス (創薬ゲノミクス・創薬プロテオミクス・創薬インフォマティクス) -- (創薬インフォマティクス)
- 差分概念辞書を用いた過度の仕様抽象度の修正
- データベース最前線(11)データマイニング--巨大データからの知識発見(2)
- データベース最前線(10)データマイニング--巨大データからの知識発見(1)
- 最適相関ルールによる髄膜炎データの分析 (テーマ「共通データに基づく知識発見手法の比較と評価(2)」および一般)
- 領域分割決定木を利用した信用リスク管理
- LD-9 自然言語処理技術と構造化パターンマイニングを用いたFAQ生成支援システム(D. データベース)
- 大規模データベースからの頻出構造化パターンの抽出
- Roberto J. Bayardo Jr. and Rakesh Agrawal: "Mining the Most Interesting Rules", Proceedings, Fifth International Conference on Knowledge Discovery and Data Mining, pp. 145-154(1999)
- 複数の集約演算のための並列アルゴリズム (高度データベース論文特集)
- 複数の集約計算のための並列アルゴリズム
- 複数の集約計算のための並列アルゴリズム
- 形式的仕様による部品検索に基づいた部品合成手法について
- サービス要求モデルに基づく電力消費最適化手法の提案
- 述語論理型仕様を用いた部品検索とその評価
- 述語論理型仕様を用いた部品検索とその評価