競合学習を用いた情報理論的クラスタリング文書クラスタリングにおける基準及びアルゴリズムの比較
スポンサーリンク
概要
- 論文の詳細を見る
情報理論的クラスタリング(ITC:information-theoretic clustering)は,特徴分布の類似性によりクラスタをまとめる方法である.近年,クラスタリング基準が明確化され,この基準の最適化によるITCアルゴリズムが提案された.このアルゴリズムは,k-means法においてデータが属するクラスタラベルを更新する時に評価関数としてKL(Kullback Leibler)ダイバージェンスを用いる.最近,この考え方に基づいた,新しいアルゴリズムが提案されたその手法は,ゼロ頻度問題を回避するため,KLダイバージェンスの代わりにその近似であるskewダイバージェンスを用い,学習アルゴリズムとしては,k-means法に対する優位性が確認されている競合学習を用いる.本稿は,前記手法がテキストデータを対象とした多クラス問題において,最大マージンクラスタリングや混合von Mises-Fisher分布に基づく方法などの既存アルゴリズムに比べて優れていることを実験により示した.
- 2012-08-26
著者
関連論文
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- マルチスペクトル撮影による光源スペクトルの計測(画像認識,コンピュータビジョン)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- αダイバージェンスに基づく単語連想と文書分類への適用(テーマ関連セッション3)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 医療分野に特化した概念ベースによるDPCコーディング(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 3D-6 絵文字を考慮したテキスト解析の研究(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数の Web Wrapper による高精度な情報抽出
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 全単語間共起を考慮した概念ベース生成手法(一般,First Person Visionのための認識・理解)
- 学習データのクラスタリングを用いた文書分類(手法検討,ライフログ活用技術,オフィス情報システム,ライフインテリジェンス)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 競合学習を用いた情報理論的クラスタリング(人工知能,データマイニング)
- 競合学習を用いた情報理論的クラスタリング文書クラスタリングにおける基準及びアルゴリズムの比較
- 単語概念ベクトルを用いた文書群からの代表語抽出
- タクソノミを用いたNoveltyの高いアイテムの推薦手法(データ工学,Web情報システム)
- 単語概念ベクトルを用いた文書群からの代表語抽出
- マルコフ確率場を用いたソーシャルネットワークからのユーザ属性推定(人工知能,データマイニング,インターネット技術とその応用論文)
- 競合学習を用いた情報理論的クラスタリング文書クラスタリングにおける基準及びアルゴリズムの比較(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- 競合学習を用いた情報理論的クラスタリング文書クラスタリングにおける基準及びアルゴリズムの比較(コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)