データマイニングにおける相関関係抽出の並列処理方式
スポンサーリンク
概要
- 論文の詳細を見る
近年のプロセッサの高性能化、二次記憶装置の大容量化等の計算機技術の進展により、莫大な履歴データが蓄積され、それらのデータを解析することが可能となった。このような大量に蓄積された履歴データを解析することにより、その中に埋もれた法則や関係など有用な情報を抽出し、データの効果的な活用を図る「データマイニング(Data base Mining)」の研究が着目されている。データマイニングで得られる情報の代表的なものに、データ間の相関関係があり、これを抽出する効率の良い手法の研究が進められている。大量のデータを操作対象とする場合には、より根本的な性能向上が不可欠であり、我々は並列処理方式について研究を進めている。我々の知る限り並列化に関する報告は、ほぼ同時期に発表された[1]しかなく、3章で述べる様に[1]は候補アイテム集合を全プロセッサに複製しており、記憶効率が著しく低い。本報告では、データ複製を行わず記憶効率を大幅に向上させ、より大規模なマイニングを可能とすると同時に、性能向上を実現する方式を提案するとともに、並列計算機AP1000上に実装し、その有効性を明らかにする。
- 一般社団法人情報処理学会の論文
- 1996-03-06
著者
関連論文
- 多周期的更新アクセスに適した二次記憶管理技法 : 連続的Webクローリングへの適用(ファイル編成,情報爆発論文)
- 編集にあたって(平成21年度長尾真記念特別賞紹介)
- グリーンレプリケーション : 二次系ディスクストレージの省電力化(ストレージ 並列分散データベース,データ工学論文)
- 編集にあたって(平成21年度論文賞の受賞論文紹介)
- 大規模ウェブテキストからの片仮名用言の自動獲得(テキストマイニング,データ工学論文)
- ATM結合PCクラスタにおける動的リモートメモリ利用方式を用いた並列データマイニングの実行
- 並列DBMSに於ける動的負荷分散機構の実装
- 一般化相関ルールマイニングの並列処理方式における統計情報を用いた候補分割負荷分散手法の評価
- 大規模PCクラスタにおける並列相関ルールマイニング処理方式の評価
- ATM結合PCクラスタにおける並列データマイニングの実装とTCP再送機構の性能解析