2分決定グラフによるデータマイニングシステム
スポンサーリンク
概要
- 論文の詳細を見る
大量のデータの中に潜んでいて気がつかない, 役にたつ可能性のある知識を発見する技術のことをデータマイニング(Data Mining)と総称する。データマイニングは, 背景知識を予め持つことなく, 与えられた大量のデータのみから知識を得ることを目的とする。Agrawlらは, データマイニングを, 結合ルール(Association Rules), 分類(Classification), 逐次パターン(Sequential Patterns), 相似列(Similar Sequences)の4つに分類した。これらのルールは顧客データからの知識発見に対して高い評価を得ており, 実用化・商品化が行われている。さらに, Agrawalらは, 与えられたデータから全ての結合ルールを発見するアルゴリズムを提案し, 実験的に評価した。しかし, 彼らのアルゴリズムは理論的に効率の良いものではない。また, 得られた大量の結合ルールから更に知識を獲得する研究もなされている。一方, ゲノムデータに代表される自然科学のデータにおいても, 結合ルールの発見が試みられているが, 自然現象には直観的に予測できる規則性が少ないため, 結合ルールでは我々の望む知識の発見が難しい。本論文では, 結合ルールを2部決定グラフ(Binary Decision Diagram (BDD))により一般化した。 2部決定グラフ結合ルールを発見する問題について考察する。2部決定グラフを用いることにより, 論理積, 論理和と否定による知識表現が可能になる。2部決定グラフ結合ルールは, 2つのBDD(それぞれ, LBD, UBDと呼ぶ)からなる。多くの場合, LBDはユーザが自然な形で与えることが多いため, 本質的にこの問題はUBDを発見する問題に帰着する。本論文では, 現実的な時間でUBDを見つけるための条件について考察する。さらに, QuinlanによるID3アルゴリズムを応用したUBDを発見するアルゴリズムを, ゲノムデータに適用した実験結果について述べる。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
正代 隆義
九州大学大学院システム情報科学府・研究院
-
宮野 悟
東京大学医科学研究所
-
正代 隆義
九州大学大学院システム情報科学研究院情報理学部門
-
宮野 悟
科学技術振興事業団erato北野共生システムプロジェクト
-
丸山 修
東京大学医科学研究所
-
関 弘隆
九州大学大学院システム情報科学研究科情報理学専攻
-
正代 隆義
九州大学大学院システム情報科学{府 研究院}:財団法人九州先端科学技術研究所
関連論文
- Discovery of Closed Frequent Tag Tree Patterns from Semistructured Documents (テーマ:特集 「感性とインタラクション」および一般)
- 半構造データからの縮約可能変数つきタグ木パターンの抽出
- 半構造データからの縮約可能変数つきタグ木パターンの抽出(「アクティブマイニング」及び一般)
- 半構造データにおける極大頻出タグ木パターンの発見について
- 木構造データのパターンを用いる知識発見について
- 木構造データからの知識発見について
- 発見科学の構想と展開(発見科学)
- ダークネット観測データの時系列パタン発見によるスクリーニングについて (インターネットアーキテクチャ)
- 酵母遺伝子発現制御ネットワークの戦略的同定
- 九州大学における一般情報処理教育支援システムについて