表データからの傾向抽出方式と並列化手法
スポンサーリンク
概要
- 論文の詳細を見る
データベースに蓄積されたデータから、有用な知見や法則を発見するデータマイニングの一分析手法として、関係データベースの表形式のデータからレコードの分布の傾向を発見する方式の開発を行なった。分析対象データは、関係データベース等の表形式のデータとし、与えられた条件で選択されたレコード群に共通する特徴をデータベースの属性の属性値を用いて説明する。結果として、「属性AがX以上Y以下かつ属性BがZの時、レコードが与えられた条件を満たす確率はX%である。」等の規則が生成される。本分析手法は、分析対象属性の全ての組合せについて分析を行なうので、一つの組合せを一つのタスクとすることにより、並列化が容易である。超並列マシン上で2種類の負荷分散手法で本データマイニングアルゴリズムを並列化し、分析対象データの種類によって並列効果の違いが生じることを確認した。
- 社団法人情報処理学会の論文
- 1999-08-02
著者
-
酒井 浩
新情報処理開発機構 並列応用東芝研究室
-
仲瀬 明彦
新情報処理開発機構 並列応用東芝研究室
-
仲瀬 明彦
新情報並列応用東芝研究室
-
久保田 和人
新情報並列応用東芝研究室
-
酒井 浩
新情報並列応用東芝研究室
-
小柳 滋
新情報並列応用東芝研究室
-
仲瀬 明彦
(株)東芝総合研究所
-
小柳 滋
新情報処理開発機構並列応用東芝研究室
-
仲瀬 明彦
株式会社東芝研究開発センター
-
久保田 和人
株式会社東芝研究開発センター
-
久保田 和人
新情報処理開発機構
関連論文
- PCクラスタを用いた決定木生成
- 決定木の並列化とその評価
- 表データからの傾向抽出方式と並列化手法
- 時系列データの保持方法に関する一提案
- マルチプロセッサ性能評価システムの開発(2) : ソフトウェアトレーサ
- 知識ベ-スマシン (AI技術)
- メッセージの追い越しがある分散環境におけるプロセスの実行停止/再開方式
- メッセージの追い越しがある分散環境における低コストな外部参照管理
- D-8-14 地理情報を用いたデータマイニング手法(D-8. 人工知能と知識処理)
- SMPクラスタ向けネットワーク・インタフェースAM通信 (並列処理)
- COMPaS : Pentium Proを用いたSMPクラスタとその評価 (並列処理)
- 知識ベースマシンMu-X(1) : 並列制御方式
- 組織における知識継承のモデル化(教育工学)
- 組織における知識継承のモデル化(セッション3: マルチエージェントと複雑系(2))
- 組織における知識継承のモデル化(マルチエージェントと複雑系, 「社会システムにおける知能」及び一般)
- 耐故障/耐高負荷を考慮した並列分枝限定法と基本性能の評価(グリッド)
- 耐故障/耐高負荷を考慮した並列分枝限定法(グリッド応用)
- WWWアクセスシーケンスの新しいマイニング手法の提案(データマイニング・データウェアハウス)
- Matrix Clustering(21世紀のコンピュータセキュリティ技術) : CRM向けの新しいデータマイニング手法
- 決定木生成手法の並列化方式とその評価
- Matrix Clustering : CRM向けの新しいデータマイニング手法
- PCクラスタを用いた決定木生成
- 時系列データの保持方法に関する一提案
- クラスタ間メモリ共有型アーキテクチャにおけるKL1処理系の考察
- 並列推論マシンPIM/kの開発(2) : KL1処理系の予備評価
- 並列推論マシンPIM/kの開発(1) : KL1処理系のデバッグ手法とツール
- 知識ベースマシンMu-X(4) : 制御方式の評価
- 知識ベースマシンMu-X(2) : キュエリ解析方式
- SMPクラスタ向けネットワーク・インタフェース上AM通信
- SMPクラスタでの共有/分散融合プログラミング
- Knapsack問題における共有メモリ型/分散メモリ型並列計算機の性能比較
- Wavefront Array動作が可能な汎用超並列マシン向け結合網アーキテクチャ
- 3Dトーラスネットワークにおける大域通信性能の向上
- SMPクラスタ上でのリモートメモリ転送を用いた通信と計算のオーバーラップによる性能改善
- 問題対応型データマイニング : 小売業への適用 (データウェアハウスとデータマイニング)
- 並列プログラムデバッグのための可視化ツール
- Windows NTクラスタ上でのMyrinetによる通信の実現
- 並列プログラム可視化ツール
- 大規模データ並列プログラムの性能予測手法とNPB 2.3の性能評価 (並列処理)
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- Collective通信を用いたデータ並列プログラムの性能予測
- 並列アルゴリズムにおけるCollective通信の性能比較