数値属性の最適結合ルールを発見する効率的アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
巨大データベースの中に潜在する数値属性の結合ルール(association rule)を発見する問題について述べる.たとえば,銀行の顧客のうち,預金残高がある区間Iに入る顧客は,カードローンを利用する確率が高いとする.この知識は(預金残高∈I)⇒(カードローン利用=yes)という結合ルールとして表現できる.このようなルールは,区間Iが預金残高とカードローン利用の間の特別な性質を持つ場合についてのみ,面白いルールといえる.その性質とは,Iに含まれる顧客の数(サポート)が十分に大きく,条件を満たす確率(確信度)が十分に高いことである.我々の目的は,そのような適切な区間を自動的に発見するシステムを実現することである.我々は主に2種類の最適な区間について考える:1つは確信度がある閾値以上で,サポートが最大となる区間,もう1つはサポートがある閾値以上で,確信度が最大となる区間である.この論文ではこの問題を線形時間で解くアルゴリズムを提示し,その実装を評価して理論的計算量が確かに現実にも達成できたことを述べる.
- 1996-06-15
著者
関連論文
- 多値属性を用いた最適なデータセグメンテーションを生成するアルゴリズム
- オートノミックコンピューティング(安全で安心できるe-社会を実現するソフトウェアとシステム技術)
- 関係データベースと分散ファイルシステム上に構築したオブジェクトサーバの概要とその応用
- 関係データベースを利用したオブジェクトサーバのデータ管理
- オブジェクト指向データの関係データベースによる一保存、検索、更新手法
- オブジェクト・サーバにおけるオブジェクト共有管理
- 関係データベース上に構築するオブジェクトサーバのためのデータモデルとC_インターフェイス
- オブジェクトサーバを中心としたマルチメディア・アプリケーションのための開発および実行支援環境
- 数値データからの直交凸領域結合ルール発見
- 領域及び区間分割を用いた決定木の作成 : 領域分割の有効性の検証
- データベースからの決定木構成における数理的問題
- データマイニングの最新動向 : 巨大データからの知識発見技術 (情報処理最前線)
- 最適区間問題と計算幾何学
- 相関ルールの可視化について
- データベース最前線(11)データマイニング--巨大データからの知識発見(2)
- データベース最前線(10)データマイニング--巨大データからの知識発見(1)
- 最適相関ルールによる髄膜炎データの分析 (テーマ「共通データに基づく知識発見手法の比較と評価(2)」および一般)
- 領域分割決定木を利用した信用リスク管理
- 関係オブジェクトシステムにおけるデータベース再構成のないスキーマ進化
- 複数の集約演算のための並列アルゴリズム (高度データベース論文特集)
- 複数の集約計算のための並列アルゴリズム
- 複数の集約計算のための並列アルゴリズム
- 天下をとったという幻影? (インタラクティブ・エッセイ)
- 数値属性の最適結合ルールを発見する効率的アルゴリズム