識別問題におけるMDL基準を用いたクラスタリング法
スポンサーリンク
概要
- 論文の詳細を見る
パターン認識において, サンプルの分布に正規分布などの単純なパラメトリックモテルを仮定できない場合, k最近隣法や区分的線形識別規則などのノンパラメトリックな識別規則が有効である。これらの識別規則では, 訓練サンプル集合に対する過学習を回避するためや計算コストの削減のために, 訓練サンプル集合上の各クラスターの重心である代表点を訓練サンプル集合の代用とすることが多い。ほとんどの応用例では, このクラスター数を主観による評価で発見的に決定し, 識別問題に利用している。しかし, それでは必ずしも最適な識別性能を発揮できているとは限らず, 客観的な評価基準によるクラスター数の推定法が必要となっている。この問題に対し, 文献[1]では, サンプルの分布に混合正規分布モテルを仮定し, その特徴ベクトルの発生確率に関する尤度と, 分布を記述するパラメータ数のトレードオフをMDL基準により評価し, 最適なクラスター数の推定を試みている。しかし, この方法は教師なし学習であるため, これを識別問題に適用する場合には各クラス毎に尤度を単独で評価する必要があり, 必ずしも識別に最適なクラスター数は求められない。 そこで本研究では, 混合正規分布モテルにおいて, 文献[3]の「確率的規則の学習問題」の枠組に基づき, MDL基準を利用した, 識別を前提とした最適なクラスター数の推定を試みる。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
工藤 峰一
北海道大学大学院情報科学研究科
-
新保 勝
北海道大学大学院工学研究科システム情報工学専攻数理情報工学講座
-
工藤 峰一
北海道大学大学院工学研究科システム情報工学専攻
-
新保 勝
北海道情報大
-
工藤 峰一
北海道大学情報科学研究科
-
新保 勝
北海道大学大学院工学研究科
-
新保 勝
北海道大学
-
天元 宏
北海道大学大学院工学研究科システム情報工学専攻数理情報工学講座
-
工藤 峰一
北海道大学 大学院情報科学研究科
関連論文
- Data compression by volume prototypes for streaming data
- Probably correct k-nearest neighbor search in high dimensions
- 複数アクションを選択するAdversarial Bandit問題について
- ウエーブレットパケット解析を用いた音声符号化
- 編集距離による最類似文字列の探索高速化に関する研究(テーマ,膨大なデータから学ぶもの)
- 証拠と信念に基づくファジィ論理の一構成
- 多面体識別子族における識別子選択(一般セッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 非確率的なmulti-armed bandit問題における分散投資の効果について(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- パッキングアライメントとその音楽マイニングへの応用
- Notes on Enumeration of Concepts in a Sperner Family Concept Class Using Subconcept Queries (Foundations of Theoretical Computer Science : For New Computational View)
- 部分クラスの複雑さと列挙法について
- 木構造データに対する頻出類似部分木の発見(テーマセッション,データ工学とメディア理解との融合)
- LA_001 繰返し表現木最小化アルゴリズム(A分野:モデル・アルゴリズム・プログラミング)
- 繰返し構造をもつラベル付順序木の簡潔な表現法(計算理論とアルゴリズムの新展開)
- 両方向 N-gram 確率を用いた誤り文字検出法(自然言語処理)
- 節点包含制約を満たす頻出木マイニング
- ルールの予測精度と興味深さに関する検討(テーマセッション(1))(データマイニングとパターン認識・メディア理解)
- 両方向N-gram確率を用いた確率変化パターンによる誤り検出(テーマセッション(1))(データマイニングとパターン認識・メディア理解)
- 哺乳類における5'-スプライスサイトの配列パターンの位置木による解析
- グラフによるインタラクティブなデータ分析と決定木の構成(パターン認識)
- 識別情報を利用したクラス情報のグラフ表示
- グラフによる多次元データの構造解析
- 編集距離による最類似文字列の探索高速化に関する研究(テーマ,膨大なデータから学ぶもの)
- パターン認識における都市伝説 (パターン認識・メディア理解)
- 体積プロトタイプの解析と混合分布モデルとの比較(一般セッション,データ工学とメディア理解との融合)
- 体積プロトタイプの解析と混合分布モデルとの比較(一般セッション,データ工学とメディア理解との融合)
- パターン認識問題における終端条件の付加によるk近隣法の高速化
- スプライン曲面を用いた画像の2チャネル符号化
- 通過領域に着目した多次元空間における曲線分類
- 連母音の挙動に含まれる個人性情報の抽出
- 分枝限定法利用の最近隣法における終端条件の効果
- 複数領域の隣接関係に基づく自然シーンの高速ラベリング
- 非線形識別関数のための特徴選択
- 顔の幾何学的特徴による個人識別
- 領域の隣接関係を用いたラベル画像の生成
- 極小値が単峰列な傾向をもつ多峰関数の大域的最適化法
- 極小値が単峰列で単峰領域幅が等しい一変数多峰関数の大域的最適化法
- 無声母音のピッチと音韻性に対するホルマント周波数とスペクトルの傾斜の影響
- 無声母音のホルマント周波数と音韻性に関する検討
- 自律拡張型ネットワークモデル
- 極小値集合による単峰性および多峰性関数の定義とその性質
- 単峰領域の概念に基づく一変数多峰性関数の複数極大点および最大点探索手法
- 平坦な領域をもつ一変数多峰性関数の極小領域探索法
- 二変数多峰性関数の最小値探索アルゴリズム
- 単峰領域の概念を用いた一変数多峰性関数の最大点探索手法
- パターン認識における都市伝説(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 凸包によるクラス領域の近似
- 混合分布を用いた識別規則における最適な混合数の選択
- 手書き漢字同定のための動的モデルによるストローク抽出
- 識別問題におけるMDL基準を用いたクラスタリング法
- ラフ集合理論を用いたパターン識別
- 文献検索の可能世界モデルと信念検索
- ボルテラ級数を用いた非線形画像後元
- Browderの強収束定理の凸射影法への応用
- カラー画像セグメンテーションのためのファジィ・クラスタリング手法(ファジィ画像情報処理)
- 様相論理のDempster-Shafer理論に基づくモデルとKripkeモデルとの関係
- ミニマル・モデルの族としての拡張ファジィ測度モデルとグレード付き様相演算子
- 信念論理に基づく情報検索
- 画像の小領域に基づく復元フィルタの構成
- 6) 凸射影法における非線形射影作用素の最適順序決定(放送方式研究会)
- 証拠の蓄積が形成する信念論理に基づく知識獲得
- 凸射影法における非線形射影作用素の最適順序決定 : 放送方式
- Plausibility関数に基づく信念様相論理における証拠と推論との関係
- 測度に基づく様相論理を用いた推論
- 緩和型神経回路モデルによる図形分節候補抽出
- ずれ度を用いたファジィ制御
- ファジィ集合値関数の可測性
- T-ノルムを用いたファジィ関係の合成とそのファジィ推論への応用
- ファジィ数の無限和とファジィ確率変数に関する大数の強法則について〔含 付録〕
- ファジィ確率変数に関するルベ-グの収束定理
- 圧力センサを用いた着席者の姿勢識別に関する研究(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 圧力センサを用いた着席者の姿勢識別に関する研究(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- Design of Decision Trees Using Class-Dependent Feature Subsets
- 劣決定信号復元における最小l_1ノルム系列の効率的構成(一般セッション(8))(データマイニングとパターン認識・メディア理解)
- 階層的重複クラスタリングによるウェブ検索結果の集約(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- データ部分集合と特徴部分集合の同時選択による識別子統合(一般セッション,データ工学とメディア理解との融合)
- データ部分集合と特徴部分集合の同時選択による識別子統合(一般セッション,データ工学とメディア理解との融合)
- Knowledge-Based Enhancement of Low Spatial Resolution Images
- Interactive Data Analysis Based on Graph and Construction of Decision Trees
- 超矩形による貪欲被覆学習の効率的実装と実データによる性能評価(IBIS2010(情報論的学習理論ワークショップ))
- 木構造データに対する頻出類似部分木の発見(テーマセッション,データ工学とメディア理解との融合)
- 体積プロトタイプによるデータ集約(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 情報の粒度を用いた属性値の抽象化(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 特徴選択 : これまでと今後の展開(テーマセッション(2),パターン認識・メディア理解のための学習理論とその応用)
- 特徴選択 : これまでと今後の展開
- 最小包含球の族による被覆を用いたノンパラメトリック識別(一般セッション(2))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- 節点包含制約を満たす頻出木マイニング
- 包含と排除によるκ最近隣法の高速化(テーマセッション(3))(データマイニングとパターン認識・メディア理解)
- クラスに依存した特徴集合を用いた決定木の設計(パターン認識)
- クラスに依存した特徴集合の有効性の検討
- クラスに依存した特徴集合の有効性の検討
- 強有理切断とそのファジィ碓率変数への応用
- 多次元データの図形表示について
- 九官鳥母音の音声認識について
- 極小値が単峰列となる多峰関数の大域的最適化手法(1) : 単峰領域幅が等しい目的関数の大域的最適化(数値計算,数理計画法)
- 大規模データに対する識別子独立型の特徴選択(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- Closeness Centralityの高いノードを発見する高速アルゴリズム
- 1-Median問題の高速な近似アルゴリズム (特集 「Webと知識連携・統合,発想支援」および一般)
- マッチング選択多腕bandit問題の効率的解法アルゴリズム (特集 「Webと知識連携・統合,発想支援」および一般)
- 順列バンディット問題における新しいUCB型アルゴリズム(一般)