S^3 Bagging : サブサンプリングとBaggingによる高速な分類器生成
スポンサーリンク
概要
- 論文の詳細を見る
データマイニング過程では, 必要とする知識が抽出できるまでにデータから分類器を生成する作業を繰り返さなければならない場合が多い.このため, データマイニングツールには, 精度の高い知識を抽出するだけでなく, 高速に知識を抽出し分析者に示唆を与えることが期待される.大規模なデータから高速に分類器を生成する方法の1つとして, サンプリングを行うことにより学習データ量を削減することが考えられる.しかしながら, 学習データ量を減らすと一般的に生成される分類器の分類精度が悪化する.我々は, サブサンプリングを行うことにより高速に分類器を生成しながら, コミッティ学習の1つであるBaggingを行うことにより分類精度の劣化を防ぐ手法であるS^3 Bagging(Small SubSampled Bagging)を提案する.本稿では, S^3 Baggingの特長について, 実験を通じて考察した結果を報告する.
- 社団法人電子情報通信学会の論文
- 2000-09-18
著者
-
寺邊 正大
株式会社三菱総合研究所
-
寺邊 正大
(株)三菱総合研究所総合安全研究センター
-
寺辺 正大
三菱総合研究所総合安全研究センター
-
寺邊 正大
(株)三菱総合研究所 安全技術研究部
-
寺邊 正大
(株)三菱総合研究所
-
鷲尾 隆
大阪大学産業科学研究所
-
元田 浩
大阪大学産業科学研究所
-
寺邊 正大
三菱総研
-
鷲尾 隆
大阪大学産業科学研究所第1研究部門
関連論文
- 構文規則に基づく技術論文からの比較情報抽出に関する検討
- データマイニング手法を用いた臨床情報の新しい解析の試み : 入退院データベースの解析より(第95回日本循環器学会近畿地方会)
- 定量的アソシエーションルール分析を用いた雇用条件と雇用リスク受容の関係分析(リスク日避とデータ知能学, セマンティックWebとソフトウェア工学, 一般)
- DNS監視による異常クライアントの検知(オーバーレイネットワーク,VPN,DDoS,ネットワークセキュリティ,P2P通信,ネットワークソフトウェア,一般)
- SSL/TLSで暗号化されたWeb通信に対する侵入検知システム(セキュリティ/危機管理,新しいパラダイムの中での分散システム/インターネット運用・管理)
- B-7-15 大規模DNSサーバのための異常検知方式の提案(B-7. 情報ネットワーク,一般セッション)
- ページ閲覧時間を考慮したWebログマイニング手法の提案
- ページ閲覧時間を考慮したWebログマイニング手法の提案 (「Web Intelligence」および一般発表)
- 通信分野でのデータマイニング技術の適用事例(実用システムに見るAl技術〔第3回〕)
- マルチエージェントに基づいた予備VP予約法とその実験的評価(ネットワークソフトウェア)
- マルチエージェントを用いた無中断予備VP設定方式
- 開放型マルチエージェントシステムにおける組織学習
- 大規模地震災害時の被害波及評価のための相互依存性解析
- 半導体歩留り解析へのデータマイニング適用手法の提案
- 時系列データ解析からの帰納的熱力学(第9回『非平衡系の統計物理』シンポジウム,研究会報告)
- 時系列データ解析からの帰納的熱力学(基研研究会「非平衡系の新局面-運動・機能・構造-」,研究会報告)
- 文章密度に基づくマスメールの高速検出手法と評価(JGN II,インターネット及び一般)
- 構造データからのアクティブマイニング(アクティブマイニング)
- 記述長に基づく適応的 Ripple Down Rules 法
- AGMアルゴリズムの高速化と立体構造解析への適用
- Decision Tree Graph-Based Inductionによる肝炎データからの診断知識の抽出(9月14日)(「アクティブマイニング」及び一般)
- Decision Tree Graph-Based Inductionによる肝炎データからの診断知識の抽出(「アクティブマイニング」及び一般)
- AGMによる3次元構造と生理活性の相関解析
- Decision Tree - Graph-Based Inductionの機能拡張
- AGMによる3次元構造と生理活性の相関解析(「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- Decision Tree-Graph-Based Inductionの機能拡張(「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- グラフ構造に着目した肝炎データからの知識発見
- Apriori-based Graph Miningアルゴリズムの高速化
- パネル討論「21世紀のAIのための数理モデル」 : 議論集(「21世紀のAIのための数理モデル」)
- 部分空間クラスタリングと相関規則に基づく分類学習手法
- 高速汎用パターン検索手法とその実適用(9月14日)(「アクティブマイニング」及び一般)
- 高速汎用パターン検索手法とその実適用(「アクティブマイニング」及び一般)
- 文章密度に基づくマスメールの高速検出手法と評価(JGNII,インターネット及び一般)
- 一流国際会議発表のための研究戦略とは?(国際会議に通すための英語論文執筆)
- 第15回人工知能国際会議報告
- 顧客動線研究の枠組み--マーケティングにおける新しい研究フロンティア (知識ベースシステム研究会(第91回)学習およびその応用)
- 変数間因果関係に関するリレーショナルデータマイニングへの取り組み(特別セッション,機械学習とその応用)
- 3ZP-7 高次元状態空間に対する粒子フィルタIEPFの提案(情報爆発時代におけるデータマイニング・アルゴリズム,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 会議報告 : IJCAI99
- 6ZK-3 大規模次元観測時系列のダイナミクスモデルに関する研究(情報爆発時代におけるストリームデータと実世界情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 4J-1 情報爆発時代の広告研究(情報爆発時代におけるデータマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 論文特集:「データマイニングと統計数理」
- データインテンシブコンピューティング : その1 離散構造マイニング(知能コンピューティングとその周辺(第1回))
- 知識発見から知識体系発見へ(編集委員2007年の抱負)
- 適応的密度基準に基づく部分空間クラスタリングを用いた定量的多頻度アイテム集合のマイニング
- 生産プロセス品質管理におけるデータマイニングの現状(データ解析の最前線)
- Random Tree based Committee Learningによる企業収益リスクモデルの構築(ビジネスとデータマイニング, 「安全・安心な社会生活の実現に向けた知識の活用とソフトウェア開発支援」及び一般)
- グラフマイニングとその統計的モデリングへの応用 (特集 予測と発見)
- 数値属性を含む多頻度アイテム集合導出手法"QFIMiner"の統計的改良 (テーマ:「データマイニングと統計数理」および一般)
- 定量的相関規則導出手法による離散マルコフ連鎖モデリング (テーマ:「データマイニングと統計数理」および一般)
- Random Tree based Committee Learning による企業収益リスクモデルの構築 (テーマ:「安全・安心な社会生活の実現に向けた知識の活用とソフトウェア開発支援」および一般)
- 3. グラフベースデータマイニングの基礎と現状(最新!データマイニング手法)
- 大規模ビジネスデータからの知識発見システム : MUSASHI(研究のツールボックス(2))
- E-023 テキストマイニングを用いたサッカー勝敗分析記事からの評判分析(E分野:自然言語・音声・音楽,一般論文)
- 多頻度グラフマイニング手法の一般化
- マルチエージェントを用いた無中断予備VP設定方式
- マルチエージェントを用いた無中断予備VP設定方式
- 一般グラフ構造データに対する Graph-Based Induction とその応用
- Graph-Based Induction による化学構造データからの知識発見
- Graph-Based Inductionの一般グラフへの拡張とその実験的評価
- 逐次ペア拡張による木構造データからの分類規則学習
- Graph-Based Inductionによるコマンド予測 : 予測精度向上に関する枝刈りの効果
- マルチエージェントに基づいた予備VP予約法とその適応性に関する実験的評価
- マルチエージェントに基づいた予備VP予約法とその適応性に関する実験的評価
- マルチエージェントに基づいた予備VP予約法とその適応性に関する実験的評価
- MUSASHI上で動くデータマイニング指向CRMシステム : C-MUSASHI(9月14日)(「アクティブマイニング」及び一般)
- MUSASHI上で動くデータマイニング指向CRMシステム :C-MUSASHI(「アクティブマイニング」及び一般)
- データマイニングシステム:MUSASHI
- データマイニングシステム:MUSASHI(「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- 材料リスク情報プラットフォームメインシステムの開発計画
- S^3Baggingによる高速な分類器生成
- S^3 Baggingによる高速な分類器生成
- S^3 Bagging : サブサンプリングとBaggingによる高速な分類器生成
- サンプリングとcommittee学習による決定木生成の高速化
- 相関ルールにもとづく属性生成手法
- 属性間相関ルールにもとづく決定木改良のための属性統合手法
- ソフトウェア・エージェントによる原子力発電プラントの事故時自動操作系の概念設計に関する研究
- 決定木アルゴリズムのためのデータ前処理手法に関する検討
- マルチエージェントモデルを用いた集団帰納学習に関する一考察
- マルチエージェントによる組織学習に関する考察
- 統計的大規模因果推論の課題と非ガウス性に基づく挑戦 (特集 「ベイジアン・ネットワークと応用」および一般)
- 3W-2 アンサンブル学習におけるHoeffding Treeを用いた動的な分類器統合法(学習(2),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- E-006 技術論文からの比較情報抽出(自然言語・音声・音楽,一般論文)
- RF-005 数値データストリームからの決定木導出(人工知能・ゲーム,査読付き論文)
- 科学的根拠に基づく医療(EBM:Evidence-Based Medicne)におけるデータマイニングの適用事例と今後の展望,課題について(データマイニング実践家達の声(5))
- 大量データのためのコミッティ・マイニング手法に関する研究 : 機械学習・データマイニング(「人工知能分野における博士論文」)
- 最小記述長原理を用いた帰納学習の Ripple Down Rules 法への統合化
- 科学的根拠が揃っていないときに政治家はリスクを判断しなくてはならない(実際に失敗を活かす,連載講座)
- 失敗の利益と損失(失敗を活かす)
- 失敗を活かすための社会学(失敗を活かす)
- 失敗知識の活用手法の開発 (特集 安全と安心の追求)
- 学習エ-ジェントを用いた協調学習に関する考察 (小特集「ポストエ-ジェント」セッション)
- 開放型マルチエ-ジェント組織における意思決定と学習
- 栗原グリーンプロジェクト - 環境負荷低減型のまちづくりを目指したICTシステムの構想 -
- 栗原グリーンプロジェクト - 広域分散地域におけるエネルギー管理システム -
- 半導体歩留り解析に回帰木分析を適用するための仮説検証手法の提案
- 半導体歩留り解析のための回帰木に基づく仮説検証手法の提案
- 半導体歩留り解析のための回帰木に基づく仮説検証手法の提案
- 消費電力観測値に基づく生活状況推定システムの設計(品質制御,輻輳制御,信頼性技術,IPTV,コンテンツネットワーク,ネットワークソフトウェア及び一般)
- 電力の有効利用を実現する生活行動プランニング手法(品質制御,輻輳制御,信頼性技術,IPTV,コンテンツネットワーク,ネットワークソフトウェア及び一般)