混合ガウスモデルを用いた自動画像アノテーション手法に対するノンパラメトリックベイズモデルの適用(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)

概要

論文の詳細を見る
自動画像アノテーション(Automatic Image Annotation:AIA)とは,キャプション,キーワードという形で,デジタル画像に自動的にメタデータを付与する処理のことである.本レポートでは,混合ガウス分布モデル(Gaussian mixtUre model:GMM)を確率モデルとして用いたAIAアルゴリズムの改善に対する取り組みに関して報告する.GMMを確率モデルとして用いているAIAの代表的な従来手法であるSupervised Multiclass Labeling(SML)では,GMMの混合要素数は全てのラベルに対して一律に与えられているのみであった.GMMの性能は,いくつのガウス分布を重ね合わせるかを定める混合要素数に大きく依存することが知られている.そこ本研究では,混合要素数も事前に定めず,それぞれのラベルに対して与えられた学習データから最適な値を学習させることを試みた.具体的には,混合要素の生成過程として,ノンパラメトリックなベイズ推定モデルであるDirichlet Processを導入した.自動画像アノテーションの標準的なテストコレクションCorel 5K画像データベースによる評価を行った結果,提案手法は,従来モデルと比較して,安定した性能を示すことが分かった.
2012-08-26