多次元構造データからの分類知識の獲得
スポンサーリンク
概要
- 論文の詳細を見る
Recently, the research area of mining in structured data has been actively studied. However, since most techniques for structured data mining so far specialize in mining from single structured data, it is difficult for these techniques to handle more realistic data which is related to various types of attribute and which consists of plural kinds of structured data. Since such kind of data is expected to be going to rapidly increase, we need to establish a flexible and highly accurate technique that can inclusively treat such kind of data. In this paper, as one of the techniques to deal with such kind of data, we propose data mining algorithms of mining classification rules in multidimensional structured data. First, an algorithm with two pruning capabilities of mining correlated patterns is introduced. Then, top-k multidimensional correlated patterns are discovered by using this algorithm repeatedly in the fashion like a beam search. We also show the algorithms for constructing classifiers based on the discovered patterns. Experiments with real world data were conducted to assess the effectiveness of the proposed algorithms. The results show that the proposed algorithms can construct comprehensible and accurate classifiers within a reasonable running time.
- 2007-11-01
著者
-
尾崎 知伸
大阪大学サイバーメディアセンター
-
大川 剛直
神戸大学大学院システム情報学研究科
-
尾崎 知伸
神戸大学 大学院 自然科学研究科
-
渡沼 智己
神戸大学 大学院 自然科学研究科
-
大川 剛直
神戸大学 大学院 自然科学研究科
関連論文
- 蛋白質-化合物複合体立体構造データに基づく類似相互作用蛋白質の検索方式(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- ビル空調の制御装置の診断システム
- 内部および外部重みを考慮した頻出部分グラフマイニング
- 外部・内部重み付きグラフマイニングにおける評価尺度の比較 (特集 「知識発見の生命科学への応用」および一般)
- 被覆集合に着目したグラフデータベースからの分割パターンの発見 (特集 「知識発見の生命科学への応用」および一般)
- 概念的類似度の更新に基づく観点を考慮した蛋白質構造解析文献の検索支援 (特集 「知識発見の生命科学への応用」および一般)
- 蛋白質-蛋白質相互作用ネットワークにおける周辺クラスタとの立体構造類似度を考慮した相互作用部位予測 (特集 「知識発見の生命科学への応用」および一般)
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- 複合構造グラフからの頻出強相関パターン発見
- 距離の再定義を伴う事例選択を用いたタンパク質機能情報文抽出方式
- 区間イベント集合に関する系列パターンマイニングの拡張 (特集 「大規模データからの機械学習と自然言語処理への応用」および一般)
- 定量的アイテム集合発見による属性付き単一グラフマイニング (特集 「大規模データからの機械学習と自然言語処理への応用」および一般)
- 拡張出現マッチングを用いた制約付きノイズ許容極小順序木パターンの発見
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- RG-001 概念階層を用いたタンパク質構造・機能情報に基づく関連文献検索支援システムの構築(生体情報科学,査読付き論文)
- 構造データ集合からなるグラフデータベースからの頻出パターン発見
- タンパク質機能情報文抽出規則の繰り返し学習における効果的学習順序の探索
- 時系列画像のエッジを利用した剛体仮定によるマッチング法の提案
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 根付き木パタン発見手法の拡張による高速飽和・極大自由木マイニング (テーマ:特集「スキルサイエンス」および一般)
- 局所類似構造を用いた蛋白質機能部位発見に関する研究
- 座標基準点探索による蛋白質相互作用プロファイルの抽出(DNA・タンパク質構造)
- 蛋白質-化合物複合体の相互作用部位プロファイルを用いた類似相互作用蛋白質検索方式(Sequence & structure analysis)
- 蛋白質分子表面モチーフの抽出とその並列化実装(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- 制限付き最右拡張を用いた効率的な飽和順序木の発見
- 反応構造プロファイルによる異種生物種間の代謝パスウェイ比較解析
- 順序木データベースからの相互非類似パターン集合の発見 (「スキルサイエンス」「論理プログラミング」及び一般)
- グラフデータベースからの上位K強相関部分グラフ対の発見 (「スキルサイエンス」「論理プログラミング」及び一般)
- 多次元構造データからの分類知識の獲得
- 蛋白質機能情報抽出支援システムPROFESSにおけるSVMを利用した機能情報文特定方式(Text mining)
- タンパク質の立体構造情報と類似部分グラフマイニングを利用した結合部位の自動抽出に関する研究(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 利用者の意図を考慮した概念的観点に基づく蛋白質構造解析文献検索手法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- ICTを活用した教育・学習支援のトレンドを企画して(ICTを活用した教育・学習支援のトレンド)
- 文の接続関係を考慮した蛋白質構造解析文献からの相互作用記述文抽出方法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 多次元構造データからの決定木の構築 (テーマ:「データマイニングと統計数理」および一般)
- 3次元画像特徴量を用いた蛋白質分子表面比較
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
- 3次元画像特徴量を用いた蛋白質分子表面比較(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)