PCクラスタを用いた決定木生成
スポンサーリンク
概要
- 論文の詳細を見る
数百ギガから数テラバイトクラスのデータに対するデータマイニングを実用時間で行えるシステムの構築を検討している.その知見を得るために, データマイニングの代表的な手法である決定木について, PCクラスタをターゲットとした並列アルゴリズムを実装し, 予備評価を行った.本手法の特徴は, データを重複なく各プロセッサに分散配置すること, 中間データをディスク上に置くことで大規模なデータを扱えること, 処理手順を動的に決めることでディスクアクセスの軽減が図れることである.ベンチマークデータを用いた実験により, 16台のプロセッサで11〜24倍程度の高速化が実現された.また, オンメモリでは処理できない大規模なデータに対して動的に処理手順を変更する手法が有効であるという結果が得られた.
- 社団法人情報処理学会の論文
- 2000-03-02
著者
-
酒井 浩
新情報処理開発機構 並列応用東芝研究室
-
久保田 和人
新情報処理開発機構 並列応用東芝研究室
-
仲瀬 明彦
新情報処理開発機構 並列応用東芝研究室
-
小柳 滋
新情報処理開発機構 並列応用東芝研究室
-
仲瀬 明彦
(株)東芝総合研究所
-
小柳 滋
新情報処理開発機構並列応用東芝研究室
-
仲瀬 明彦
株式会社東芝研究開発センター
-
久保田 和人
株式会社東芝研究開発センター
-
久保田 和人
新情報処理開発機構
関連論文
- PCクラスタを用いた決定木生成
- 決定木の並列化とその評価
- 表データからの傾向抽出方式と並列化手法
- 時系列データの保持方法に関する一提案
- マルチプロセッサ性能評価システムの開発(2) : ソフトウェアトレーサ
- 知識ベ-スマシン (AI技術)
- メッセージの追い越しがある分散環境におけるプロセスの実行停止/再開方式
- メッセージの追い越しがある分散環境における低コストな外部参照管理
- D-8-14 地理情報を用いたデータマイニング手法(D-8. 人工知能と知識処理)
- SMPクラスタ向けネットワーク・インタフェースAM通信 (並列処理)
- COMPaS : Pentium Proを用いたSMPクラスタとその評価 (並列処理)
- 知識ベースマシンMu-X(1) : 並列制御方式
- 組織における知識継承のモデル化(教育工学)
- 組織における知識継承のモデル化(セッション3: マルチエージェントと複雑系(2))
- 組織における知識継承のモデル化(マルチエージェントと複雑系, 「社会システムにおける知能」及び一般)
- 耐故障/耐高負荷を考慮した並列分枝限定法と基本性能の評価(グリッド)
- 耐故障/耐高負荷を考慮した並列分枝限定法(グリッド応用)
- WWWアクセスシーケンスの新しいマイニング手法の提案(データマイニング・データウェアハウス)
- Matrix Clustering(21世紀のコンピュータセキュリティ技術) : CRM向けの新しいデータマイニング手法
- 決定木生成手法の並列化方式とその評価
- Matrix Clustering : CRM向けの新しいデータマイニング手法
- PCクラスタを用いた決定木生成
- 時系列データの保持方法に関する一提案
- クラスタ間メモリ共有型アーキテクチャにおけるKL1処理系の考察
- 並列推論マシンPIM/kの開発(2) : KL1処理系の予備評価
- 並列推論マシンPIM/kの開発(1) : KL1処理系のデバッグ手法とツール
- 知識ベースマシンMu-X(4) : 制御方式の評価
- 知識ベースマシンMu-X(2) : キュエリ解析方式
- SMPクラスタ向けネットワーク・インタフェース上AM通信
- SMPクラスタでの共有/分散融合プログラミング
- Knapsack問題における共有メモリ型/分散メモリ型並列計算機の性能比較
- Wavefront Array動作が可能な汎用超並列マシン向け結合網アーキテクチャ
- 3Dトーラスネットワークにおける大域通信性能の向上
- SMPクラスタ上でのリモートメモリ転送を用いた通信と計算のオーバーラップによる性能改善
- 問題対応型データマイニング : 小売業への適用 (データウェアハウスとデータマイニング)
- 並列プログラムデバッグのための可視化ツール
- Windows NTクラスタ上でのMyrinetによる通信の実現
- 並列プログラム可視化ツール
- 大規模データ並列プログラムの性能予測手法とNPB 2.3の性能評価 (並列処理)
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- Collective通信を用いたデータ並列プログラムの性能予測
- 並列アルゴリズムにおけるCollective通信の性能比較