BDDを用いたデータマイニング
スポンサーリンク
概要
- 論文の詳細を見る
Mining for association rules in large databases is an important data, mining problem. Many algorithms have been proposed since the problem was first introduced in 1993. Basically, the procedure of mining association rules can be divided into two steps: first find out all frequently appearing sets of items (large itemsets), then caculate association rules using the large itemsets. Once all the large itemsets are obtained, the generation of association rules is quite simple. In Jiang, Inaba, Imai, we first proposed a new approach for generating large itemsets by using Binary Decision Diagram (BDD). Extensive experiments using BEM-II package are conducted to evaluate large itemset generation performance, and the results show that BDD represents and manipulates the large itemsets efficiently. In this paper, we will first review some of our previous work, then show how to improve the basic BDD algorithm to cope with the actual large database. At last, we discuss the possibility of applying BDD to sampling method. Also the relation between the prime implicants of BDD and the candidate sets will be carefully examined.
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
稲葉 真理
東京大学大学院情報理工学系研究科
-
今井 浩
東京大学理学部情報科学科
-
稲葉 真理
東大
-
稲葉 真理
東京大学理学系研究科
-
今井 浩
東京大学理学系研究科情報科学専攻 Erato今井量子計算機構プロジェクト 科学技術振興事業団
-
姜 力
東京大学理学部情報科学
関連論文
- パケット喪失履歴に基づいたTCP輻輳制御方式 (コンピュータシステム)
- ハードウェア・エンジンを用いた10GbE上のTCP通信解析(HPC-17 : 高性能通信)
- 難読化コンパイラのユーザによる保護強度調整機構(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 並列TCPストリーム間協調を目的とした流量調整機構Stream Equalizerの性能評価(HPC-11:通信,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 細粒度パケット間隔制御の実装と評価(OS-4: 通信システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- インテリジェントNICを用いた高帯域ネットワーク向けTCP通信方式(OS-3:ネットワーク)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 動的逆アセンブル手法の高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 双対モデリングを用いた充足可能性問題のCNF encoding
- 双対変数を用いたA^*両方向探索アルゴリズムと経路誘導における最短路問題
- 経路誘導における最短路問題の解法について
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Internet2 Land Speed Record : 長距離TCP通信高速化への挑戦
- 超高速インターネット通信におけるFPGA技術の利用(超並列SIMDプロセッサ,先端的コンピュータシステム技術及び一般)
- ゲートウェイによる並列TCPのウィンドウサイズ平均化(HPC-15 : ネットワーク)
- Sakura-C : 超並列計算機向けC言語と最適化(HPC-1 : 最適化)
- 連載:理学のキーワード : 第29回
- プログラミング言語MLのCUDA向け拡張
- SIMD型計算機向けループ自動並列化手法
- 動的推定によるプリフェッチ量最適化
- Webブラウザを用いた長距離データ転送の高速化
- コヒーレントでないメモリシステムへのアーキテクチャ支援
- 幾何クラスタリングとデータマイニング
- Ruby用仮想マシンにおけるAOTコンパイラ
- メニーコアプロセッサ向き共有キャッシュ配分方式
- マップ型履歴を用いたプリフェッチ方式とキャッシュ置換方式の協調動作
- 線形マトロイド・グラフアレンジメント・半順序での数え上げ問題に対する組合せ的・幾何的アプローチ
- トピックス
- 二分決定グラフのトップダウン構成法と並列化
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- オフライン環境における多様性の高い実行時自己改変ソフトウェア(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 日米間QoSによるLFN高速化実験と分散KVSの構築(研究発表,ネットワーク研究開発テストベッド運用・利用,一般)
- TCPによる長距離ディスク間データ転送の高速化
- Computational Geometry on Statistical Manifolds for Clustering : Extended Abstract (Models of Computation and Algorithms)
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 部分的試行に基づく動的共有キャッシュ分割方式
- GeForce GTX 280 vs. Cell
- フィードバックを用いたハイブリッド・プリフェッチ方式
- 長距離広帯域ネットワークでのTCP/IP Acknowledge Packet受信の影響ついて(インターネット応用及び一般)
- 長距離広帯域ネットワークでのTCP/IP Acknowledge Packet受信の影響ついて(インターネット応用及び一般)
- 10ギガビットネットワーク上での高効率TCP/IP通信の実現(HPC-17 : 高性能通信)
- Real Long Fat NetworkにおけるTCP/IPv6の通信性能評価(インターネット及び一般)
- Real Long Fat NetworkにおけるTCP/IPv6の通信性能評価(インターネット及び一般)
- FLASHを用いたリアルタイム講演中継システムとその特性(インターネット運用・管理技術,一般,インターネット運用・管理技術,一般)
- 擬似ネットワーク環境におけるTCP/IPの性能評価(インターネット及び一般)
- 擬似ネットワーク環境におけるTCP/IPの性能評価(インターネット及び一般)
- TCPストリームによる世界最長10ギガビット高速通信回線実験 : Internet2 Land Speed Recordへの挑戦(インターネット・フォトニックネットワークアプリケーション, 一般)
- TCPストリームによる世界最長10ギガビット高速通信回線実験 : Internet2 Land Speed Record への挑戦
- 高レイテンシ環境下におけるデータレゼボワールの性能評価
- MK-4 Data Reservoir : 科学技術研究向け超高速ネットワーク基盤(大型プロジェクト紹介,学術系企画)
- 超高速ネットワーク用データ共有システム : データレゼボワールの性能評価
- Data Reservoirプロトタイプシステム : アプローチと実験結果
- Data Reservoir : 理学研究のための新しい超高速ネットワーク利用基盤
- 量子計算の科学
- 量子計算の科学
- 量子計算の科学
- 量子計算の科学
- 量子計算の科学
- 量子計算の科学
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 三角形分割の最適性と整数計画による定式化
- Optimality and Integer Programming Formulations of Triangulations in General Dimension
- 三角形分割の最適性と整数計画による定式化
- パケット喪失履歴に基づいたTCP幅輳制御方式(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- CometインテリジェントNICの応用(第1版)(ネットワーク・インターネット基礎,産学連携論文)
- Comet インテリジェントNICの応用(第1版)
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- 協調動作する並列TCPストリームへのPacket Spacingの適用とその評価(HPC-10 : ネットワークとスケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- ギガビットイーサネット上での遠距離TCP通信におけるPacket Spacing(インターネット関連技術,及び一般)
- ギガビットイーサネット上での遠距離TCP通信におけるPacket Spacing(インターネット関連技術,及び一般)
- 地理情報システムの標準化動向と参照モデル
- 超並列SIMDマシン上でのMIMDプログラム実行スケジューリング最適化(大規模システム,SWoPP2006)
- flat-c: 超並列計算機向けC言語の実現(HPC-9: 並列プログラミング)
- RL-001 FPGAを用いた広帯域高遅延ネットワーク向けの利用可能帯域推定(L分野:ネットワーク・セキュリティ,査読付き論文)
- Euclid距離による凸多角形の多角形領域内へのmaximin配置問題とそれに関連した動的Voronoi図
- 長距離・短距離通信が混在する環境でのTCP/IPのデータ転送速度の理論的解析
- 1方向確率的可逆および1方向量子1カウンタオートマトン (代数系,形式言語および計算理論)
- MK-5 戦略ソフトウェア創造人材養成プログラム(大型プロジェクト紹介,学術系企画)
- ランダマイズドクラスタリングアルゴリズムに関する実験結果について
- Randomized Algorithms for Variance-Based $k$-Clustering
- 点集合を分散の総和が最小となるようにk個のクラスターに分割するアルゴリズム
- Polytopes of linear programming relaxation for triangulations
- Grobner Bases of Acyclic Tournament Graphs and Hypergeometric Systems on the Group of Unipotent Matrices (Algorithms for D-modules)
- Complexity of Grobner Bases for Toric Ideals of Acyclic Tournament Graphs (Foundations of Computer Science)
- BDDを用いたデータマイニング
- 量子計算機シミュレーションシステム (新しいパラダイムとしてのアルゴリズム工学)
- HPC Ruby:静的解析に基づくRubyの高度最適化コンパイラ
- BTBへのBimode Cascading手法適用による分岐先アドレス予測の高効率化
- 多様な履歴の利用による分岐予測精度の向上
- 実用的なRuby用AOTコンパイラ
- 並列TCPストリームのための流量割り当て方式(HPC-2 : 通信方式)
- 動的再構成を用いたアプリケーションレイヤ処理エンジンの設計(ネットワーク, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- バンド幅チャレンジとネットワーク背景技術
- 情報検索・全文データベースでの文書クラスタリングでの幾何構造活用
- データマイニングでのクラスタリング