2分決定グラフによるデータマイニングシステム
スポンサーリンク
概要
- 論文の詳細を見る
大量のデータの中に潜んでいて気がつかない, 役にたつ可能性のある知識を発見する技術のことをデータマイニング(Data Mining)と総称する。データマイニングは, 背景知識を予め持つことなく, 与えられた大量のデータのみから知識を得ることを目的とする。Agrawlらは, データマイニングを, 結合ルール(Association Rules), 分類(Classification), 逐次パターン(Sequential Patterns), 相似列(Similar Sequences)の4つに分類した。これらのルールは顧客データからの知識発見に対して高い評価を得ており, 実用化・商品化が行われている。さらに, Agrawalらは, 与えられたデータから全ての結合ルールを発見するアルゴリズムを提案し, 実験的に評価した。しかし, 彼らのアルゴリズムは理論的に効率の良いものではない。また, 得られた大量の結合ルールから更に知識を獲得する研究もなされている。一方, ゲノムデータに代表される自然科学のデータにおいても, 結合ルールの発見が試みられているが, 自然現象には直観的に予測できる規則性が少ないため, 結合ルールでは我々の望む知識の発見が難しい。本論文では, 結合ルールを2部決定グラフ(Binary Decision Diagram (BDD))により一般化した。 2部決定グラフ結合ルールを発見する問題について考察する。2部決定グラフを用いることにより, 論理積, 論理和と否定による知識表現が可能になる。2部決定グラフ結合ルールは, 2つのBDD(それぞれ, LBD, UBDと呼ぶ)からなる。多くの場合, LBDはユーザが自然な形で与えることが多いため, 本質的にこの問題はUBDを発見する問題に帰着する。本論文では, 現実的な時間でUBDを見つけるための条件について考察する。さらに, QuinlanによるID3アルゴリズムを応用したUBDを発見するアルゴリズムを, ゲノムデータに適用した実験結果について述べる。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
正代 隆義
九州大学大学院システム情報科学府・研究院
-
宮野 悟
東京大学医科学研究所
-
正代 隆義
九州大学大学院システム情報科学研究院情報理学部門
-
宮野 悟
科学技術振興事業団erato北野共生システムプロジェクト
-
丸山 修
東京大学医科学研究所
-
関 弘隆
九州大学大学院システム情報科学研究科情報理学専攻
-
正代 隆義
九州大学大学院システム情報科学{府 研究院}:財団法人九州先端科学技術研究所
関連論文
- Discovery of Closed Frequent Tag Tree Patterns from Semistructured Documents (テーマ:特集 「感性とインタラクション」および一般)
- 半構造データからの縮約可能変数つきタグ木パターンの抽出
- 半構造データからの縮約可能変数つきタグ木パターンの抽出(「アクティブマイニング」及び一般)
- 半構造データにおける極大頻出タグ木パターンの発見について
- 木構造データのパターンを用いる知識発見について
- 木構造データからの知識発見について
- 発見科学の構想と展開(発見科学)
- ダークネット観測データの時系列パタン発見によるスクリーニングについて (インターネットアーキテクチャ)
- 酵母遺伝子発現制御ネットワークの戦略的同定
- 九州大学における一般情報処理教育支援システムについて
- 繰り返し内部構造変数を持つ木パターンの有限和の質問学習
- 5A-4 大規模フロアプランデータベースからの頻出部分パターンマイニング(数理モデル化と問題解決,一般セッション,ソフトウェア科学・工学)
- 高さ制約変数を持つ順序木パターン言語の正データからの多項式時間帰納推論可能性について
- Discovery of Maximally Frequent Tag Tree Patterns with Contractible Variables from Semistructured Documents (人工知能基礎論研究会(第54回)特集「医療及び化学情報マイニング」および一般)
- Polynomial Time Learnabilities of Tree Patterns with Internal Structured Variables from Queries (New Aspects of Theoretical Computer Science)
- Polynomial Time Inductive Inference of Ordered Term Trees with Contractible Variables from Positive Data (New Aspects of Theoretical Computer Science)
- Extraction of Tag Tree Patterns with Contractible Variables from Semistructured Data (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般)
- Polynomial Time Inductive Inference of Ordered Tree Patterns with Internal Structured Variables from Positive Data (テーマ:一般演題及び「webとtext」)
- Discovery of Maximally Frequent Ordered Tag Tree Patterns in Semistructured Data (テーマ:一般演題及び「webとtext」)
- D-8-7 正データから多項式時間帰納推論可能な順序木構造パターンのクラスについて
- 学生の理解度と問題の難易度を動的に評価する練習問題自動生成システム(学習支援)
- 単方向リングにおけるリーダー選択問題のメモ数について
- 学生の理解度と問題の難易度を動的に評価する練習問題自動生成システムAEGIS
- 内部変数付き木パターン言語の有限和の質問学習
- D-8-28 一般化結合ルールのデータマイニングとその近似可能性について
- グラフパターンを用いた幾何構造データの可逆的な圧縮手法 (論理と学習)
- リカレントニューラルネットワークによる細胞内反応経路の脆弱・頑健部位の推定手法(バイオサイバネティックス,ニューロコンピューティング)
- D-2-14 細胞内反応経路の脆弱部位推定に関する一考察(D-2. ニューロコンピューティング,一般セッション)
- GONとSBMLにおけるXMLパスウェイ形式の対応
- リカレントニューラルネットワークを用いた細胞内反応システムにおけるロバストネス瓦解部位予測
- Java RMI による Genomic Object Net の分散オブジェクト化(バイオエンジニアリングI)
- Java Genomic Object Net と SBML Level2間におけるXMLパスウェイのファイル変換(バイオエンジニアリングI)
- 知識発見システムのためのView Designer
- プログラミング教育のためのWEB上の動作表示システム
- ダークネット観測データの時系列パタン発見によるスクリーニングについて(マルウェア対策,インターネットセキュリティ,一般)
- 辺縮約制約を持つ部分k-木への辺縮約問題に対する多項式時間アルゴリズム
- 半構造データにおける極大頻出タグ木パターンの発見について
- 半構造データにおける極大頻出タグ木パターンの発見について
- Discovery of Maximally Frequent Tag Tree Patterns in Semistructured Data (New Developments of Theory of Computation and Algorithms)
- Polynomial Time Matching Algorithms for Tree Structured Patterns (Foundations of Computer Science)
- グラフデータからの知識発見システムKD-FGSについて
- Refutable Inference of Formal Graph Systems and NLC Graph Grammars (Models of Computation and Algorithms)
- ビューデザイン機能をもつ発見支援システム--データと計算機実験
- 並列知識獲得システムBONSAI Garden
- BONSAI Garden:学習アルゴリズムによるアミノ酸配列からの並列知識獲得システム
- 形式グラフ体系上の反駁木問題の並列化とグラフ同型問題(計算機構とアルゴリズム)
- 複数実験条件下における遺伝子ネットワーク比較のための推定法(セッション4A)
- 超高次元時系列データからの遺伝子ネットワーク推定について
- ペトリネットによる転写制御ネットワークのモデリングと統計的推測(一般セッション1)
- 異種ゲノムデータの統合による遺伝子ネットワーク推定手法 (特集 予測と発見)
- 機械学習によるタンパク質N-ミリストイル化規則の予測(Sequence & structure analysis)
- T-インバリアントによるシグナル伝達経路の構造表現(グラフ, ペトリ, ニューラルネット及び一般)
- T-インバリアントによるシグナル伝達経路の構造表現(グラフ, ペトリ, ニューラルネット及び一般)
- シグナル伝達経路解析のためのペトリネットに基づく形式的表現の提案(コンカレントシステム, 一般)
- ダイナミックパスウェイモデリング言語:CSML (ゲノムから生命システムへ) -- (ゲノムから情報科学)
- ハイブリッド関数ペトリネットによる分裂酵母細胞周期のモデル化とシミュレーション(コンカレント工学及びハイブリッドダイナミカルシステムの理論と応用,一般)
- B-8 共通配列探索手法とベイジアンネットワークによる遺伝子ネットワーク推定(企画セッション:DNAアレイデータ解析に関する統計的諸問題)(2003年度統計関連学会連合大会記録(日本統計学会第71回大会))
- B-7 遺伝子発現データと生物学的知識からの遺伝子ネットワークの推定(企画セッション:DNAアレイデータ解析に関する統計的諸問題)(2003年度統計関連学会連合大会記録(日本統計学会第71回大会))
- B-5 ベイジアンネットワークと測定ノイズロバストな遺伝子ネットワークの推定(企画セッション:DNAアレイデータ解析に関する統計的諸問題)(2003年度統計関連学会連合大会記録(日本統計学会第71回大会))
- 生命をシステムとして理解するための計算戦略 : Cell Illustrator の開発
- がんの多様な鍵分子を探索するネットワーク推定法(セッション3B)
- パスウェイロジスティック回帰モデルに基づくがんの多様性解析(セッション3B)
- ダークネット観測データの時系列パタン発見によるスクリーニングについて(マルウェア対策,インターネットセキュリティ,一般)
- 線形計画法による非線形システムS-systemの推定
- バイオパスウェイモデリングとシミュレーションを実現するためのシステム : Genomic Object Net(「バイオインフォマティクスの世界」)
- BONSAI : 決定木とインデックス化による文字列からの機械発見システム
- 位置依存スコア行列の例からの学習の計算複雑度について
- On the Complexity of Data Mining for Binary Decision Diagram Rules
- 2分決定グラフによるデータマイニングシステム
- Learning Conformation Rules
- 共通配列探索手法とベイジアンネットワークによる遺伝子ネットワーク推定
- ベイジアンネットワークと測定ノイズロバストな遺伝子ネットワークの推定
- 遺伝子発現データと生物学的知識からの遺伝子ネットワークの推定
- E-CellからGenomicObjectNetへのバイオパスウェイモデルの変換
- 項グラフ言語の正データからの多項式時間帰納推論可能性について(計算理論とその応用)
- 項グラフ言語の正データからの多項式時間帰納推論可能性について
- BONSAIによる生物学文献データベースからの知識発見
- 行列乗算とハッシュ関数を用いたブーリアンネットワークの同定アルゴリズム
- ゲノムデータベース(5)配列データからの知識発見
- コンピュ-タの推論による知識発見の支援(情報) (ゲノムサイエンス--生命の全体像の解明をめざして) -- (第1部 日本におけるヒト・ゲノム研究の最前線)
- 線形計画法による非線形システム S-system の推定
- ブーリアンネットワークの高速同定アルゴリズム
- ロバストな内積計算を用いたスパース学習(セッション2B)
- 5-4 ゲノムデータからの知識発見と遺伝子オブジェクトのシミュレーション (21世紀の医療・福祉を支える科学技術)
- タグ付きテキストからの問題自動生成システム
- 最大共通誘導部分グラフ問題のMAX SNP-hardness について(計算理論とその応用)
- バイオパスウェイのモデル化とシミュレーションに向けて(第11回年会「総合講演」)
- ゲノムデータと発見科学
- 遺伝子発現パターンからの細胞分類アルゴリズム
- バイオインフォマティクスの新しい流れ
- 「バイオインフォマティクスは躍る」
- E-CellからGenomicObjectNetへのバイオパスウェイモデルの変換
- 分岐数限定超グラフに対する極大独立集合を求めるNCアルゴリズム
- GONとSBMLにおけるXMLパスウェイ形式の対応
- コメント (「明示的理解に魅せられて」へのコメントと回答)
- 生物情報データからの知識発見にむけて
- ヒトゲノム解析センター情報系分野の目指すもの
- ゲノム情報処理における最適化(最適化の数理)
- 6.ゲノムデータからの知識発見 (「ゲノム情報」)
- シミュレーションを通じた感染症対策の設計 : 選択的ワクチン投与による集団免疫強化の事例から(ビッグデータとデータ同化)