最適化から見たデータマイニング(<特集>活躍する機械学習)
スポンサーリンク
概要
- 論文の詳細を見る
機械学習とデータマイニングは,データから知識を見つけ出すという意味において同じようなものとしてとらえられることが多いが,実態としては,その方向性に大きな違いがある.機械学習が全体を俯瞰した知識を少量得るのに対し,データマイニングは局所的な構造を大量に得ることを目的とし,特に大規模なデータに焦点を当てている.本稿ではOR的,特に最適化的な視点からデータマイニング,特にパターンマイニングを解釈し,その技術を紹介する.列挙的な計算での大規模データの取り扱い方と,実データ持つ構造に対するアルゴリズムの挙動,大規模データでの効率性の秘密もあわせて紹介する.
- 2012-07-01
著者
-
宇野 毅明
国立情報学研究所
-
宇野 毅明
東京工業大学 システム科学専攻
-
宇野 毅明
東京工業大学
-
宇野 毅明
情報学研究所
-
宇野 毅明
東京工業大学経営工学専攻
-
宇野 毅明
東京工業大学システム科学
-
宇野 毅明
情報・システム研究機構国立情報学研究所
-
宇野 毅明
国立情報学研究所(nii)
-
宇野 毅明
東京工業大学社会理工学研究科
-
宇野 毅明
国立情報学研
-
宇野 毅明
国立情報学研究所:総合研究大学院大学
関連論文
- 弦グラフおよび弦二部グラフのクラスにおけるマッチングの数え上げ
- 木の均一分割問題
- 最短路高速検索のための階層メッシュ疎化法
- 2-E-5 最短路高速検索のための階層メッシュ疎化法(組合せ最適化と応用(3))
- Enumeration of Perfect Sequences of Chordal Graph (Acceleration and Visualization of Computation for Enumeration Problems)
- 2-E-17 Enumeration of Perfect Sequences of Chordal Graph
- コーダルグラフの完全列の列挙
- 距離遺伝的グラフの木表現とその応用
- コーダルグラフの独立点集合の数えあげ問題
- 木構造の動的ネットワーク上の施設配置問題に対するO(nlog^2n)時間アルゴリズム
- 負の重みに対応した高速頻出集合発見プログラムの開発(人工知能,データマイニング)
- 1-E-4 Web版訪問介護スケジュール作成支援システム(スケジューリング)
- 計算幾何学的な手法を用いた高速相同性計算手法
- グラフクラスと部分グラフ同型性
- 計算幾何学的な手法を用いた高速相同性計算手法
- 支配集合数え上げ問題とグラフクラス
- 木構造ネットワークでの道配置問題に対する最適な算法
- 木構造ネットワーク上の部分木配置問題に対する高速解法(グラフ・ネットワーク(1))
- κ-Tree-Coreを線形時間で求めるアルゴリズム(グラフ・ネットワーク(4))
- 電力取り引きにおける約定量決定問題の高速解法
- 電力取り引きにおける約定量決定問題の高速解法(組合せ最適化(5))
- ロジスティクスにおける最適化ツールの開発(交通・輸送(2))
- パターンマイニングの新しい落としどころ : クラスタリングを用いたパターンマイニング(コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- パターンマイニングの新しい落としどころ : クラスタリングを用いたパターンマイニング(コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(2)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(1)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(2)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(1)
- 有向グラフの根付き木を列挙するアルゴリズム(グラフ・ネットワーク(2))
- The "branch-and-support" method for the maximum stable set problem
- A Cutting Plane Algorithm for Semi-Definite Programming Problems with Applications to Failure Discrimination and Cancer Diagnosis (Mathematical Science of Optimization)
- 近傍ハッシュ法によるエラー許容頻出パターン列挙(一般セッション3)
- Fast Algorithms to Enumerate All Common Intervals of Two Permutations and Their Applications(Optimization Theory in Descrete and Continuous Mathematical Sciences)
- 2.情報爆発時代のための新しい超高速アルゴリズム(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 第11回RAMPシンポジウム開催報告(ペーパーフェアー)
- 列挙アルゴリズムの高速化技法とその応用 (新しいパラダイムとしてのアルゴリズム工学)
- 極小出現区間を用いたエピソードマイニングの高速化(データベース・アルゴリズム)
- 極小出現区間を用いたエピソードマイニングの高速化(データベース・アルゴリズム)
- データインテンシブコンピューティング : その2 頻出アイテム集合発見アルゴリズム(知能コンピューティングとその周辺〔第2回〕)
- 大規模幾何データからの高速な極大部分グラフ発見 (特集 「ウェブマイニング」および一般)
- Efficient Discovery of Maximal Two-Dimensional Patterns with Don't-Cares(extended abstract) (テーマ:特集「ウェブデータの知的処理」および一般)
- 深さ優先探索に基づく変数制限つき極大モチーフの高速マイニング (テーマ:「データマイニングと統計数理」および一般)
- ワイルドカードを許した極大モチーフの列挙アルゴリズム
- 大規模データ処理に対するアルゴリズム理論からのアプローチ (第20回 回路とシステム軽井沢ワークショップ論文集) -- (新世代の計算限界)
- 非巡回的有向グラフ上のs-tパスの列挙(組合せ最適化(5))
- 大規模木構造データからの頻出無順序木パターン発見アルゴリズム (計算機科学基礎理論の新展開)
- 大規模木構造データからの頻出部分構造パターン発見アルゴリズム(文字列アルゴリズム)
- 半構造データからの効率よい無順序木パターン発見手法(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 半構造データからの効率よい無順序木パターン発見手法(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 半構造データからの効率よい無順序木パターン発見手法
- 大規模木構造データからの高速な部分構造発見(「21世紀の知識情報科学に向けて」,及び一般)
- 2部クリークを用いたclosed item setの効率的な列挙(「21世紀の知識情報科学に向けて」,及び一般)
- UMLクラス図の論理プログラミングへの変換によるデバッグについて (テーマ:特集「スキルサイエンス」および一般)
- 双対化を用いた新しい極大頻出アイテム集合の計算(「21世紀の知識情報科学に向けて」,及び一般)
- 大阪のISAAC '96に参加して(学術学会報告)
- 中小規模スタッフスケジューリング問題における調整の容易なスケジュール作成に関する研究
- コーダルサンドイッチの列挙, ランダム生成, 数え上げについて (理論計算機科学の深化 : 新たな計算世界観を求めて)
- 2-F-5 多目的最適化への列挙アルゴリズム理論からのアプローチ(数理計画(1))
- UNO は一人でも難しい (計算機科学とアルゴリズムの数理的基礎とその応用)
- DK-2-4 大規模データに対する高速類似性解析手法の構築(DK-2.JSTさきがけセッション:人と社会のための情報処理,ソサイエティ企画)
- DK-2-4 大規模データに対する高速類似性解析手法の構築(DK-2.JSTさきがけセッション:人と社会のための情報処理,ソサイエティ特別企画,ソサイエティ企画)
- 擬似クリークを列挙する多項式時間遅延アルゴリズム
- RF-006 負の重みに対応した高速頻出集合発見プログラムの開発(人工知能・ゲーム,査読付き論文)
- Genome Homology Visualization by Short Similar Substring Enumeration (Acceleration and Visualization of Computation for Enumeration Problems)
- 2-E-18 ハミング距離の短い文字列ペア列挙アルゴリズムと解析ツール(組合せ論)
- 1-A-4 修正を前提としたExcelベースのスタッフスケジューリングツールの開発(つくばOR学生発表(5))
- スタッフスケジューリングにおける修正しやすさを考慮した解の分析 (21世紀の数理計画 : 最適化モデルとアルゴリズム)
- 1-B-8 スタッフスケジューリングにおける修正しやすさを知る為の実験とその考察(スケジューリング(2))
- 1-B-9 部品の取り外しを考慮した仕掛り在庫と受注の高速マッチング(スケジューリング(2))
- 木構造動的ネットワークにおける複数個の施設配置問題(組合せ最適化(5))
- RA-003 修正作業を効果的に支援するExcelベースのスタッフスケジューリングツールの開発(モデル・アルゴリズム・プログラミング,査読付き論文)
- ゲノム情報学における高速データ処理
- 列挙アルゴリズム(新・ORの図解,学会創立50周年記念号)
- 列挙を用いたモデリングの進展(モデリング-さまざまな分野,さまざまな視点から-)
- 近年の列挙技術の進展 : 計画立案と解法(ここまで使える数理計画法)
- DS-1-16 弦グラフおよびその部分クラスの列挙(DS-1.COMP-NHC学生シンポジウム,シンポジウム)
- 頻出パターンの高速列挙
- 2部グラフの辺彩色を列挙するアルゴリズムの計算時間の解析
- 飽和系列パターンの多項式時間列挙アルゴリズム
- 飽和系列パターンの多項式時間列挙アルゴリズム
- 木に含まれる限定サイズ部分木の列挙 (コンピュテーション)
- On the base-line location problem for the maximum weight region decomposable into base-monotone shapes (New Trends in Algorithms and Theory of Computation)
- 高速クリーク・密部分グラフマイニングアルゴリズム(離散構造処理系-知能情報処理を支えるアルゴリズムの技法)
- D-1-6 マッチングアルゴリズムを用いた匿名化手法の提案(D-1.コンピュテーション,一般セッション)
- 最適化から見たデータマイニング(活躍する機械学習)
- DS-1-5 ひとりにしてくれ数(DS-1.COMP学生シンポジウム,シンポジウムセッション)
- 運用コストを重視した最適化 : 小規模な事業所で運用可能なシステムを考える
- 超グラフ中に含まれる非巡回部分超グラフの効率よい列挙 (特集 「Big data と機械学習・データサイエンス」および一般)
- 最小完全ハッシュ関数を用いたグリッドグラフ上の効率的なパス数え上げ
- 超辺の縮約を許した非巡回部分超グラフの効率よい列挙
- 木に含まれる限定サイズ部分木の列挙
- 運用コストを重視した最適化 : 小規模な事業所で運用可能なシステムを考える(論文・研究レポート)
- 隣の芝は青くない
- 基単調図形に分割可能な最大重み領域を得る基線の配置問題
- マッチングアルゴリズムを用いた大規模データk-匿名化の解法
- 長さ極大な群れパターンを軌跡集合から効率良く発見するアルゴリズム
- 大規模データに対する情報損失の少ないk-匿名化手法
- 大規模データに対する情報損失の少ないk-匿名化手法
- 単位正方形上の一意被覆問題に対する近似アルゴリズム
- 長さ極大な群れパターンを軌跡集合から効率良く発見するアルゴリズム(一般)