映像のセマンティックインデクシングのためのq-混合ガウス分布

概要

論文の詳細を見る
近年,Bag-of-visual-words(BoW)法を確率的枠組みに発展させた混合ガウス分布(Gaussian mixture models; GMMs)が,映像のセマンティックインデクシングにおいて,映像から抽出された局所特徴の分布の表現に効果的であることが報告されていろ.ガウス分布はBoltzmann-Shannonエントロピーを最大化する確率分布として導出されるが,物理学における複雑系の分野では,Boltzmann-Shannonエントロピーを一般化したTsallisエントロピー[9]から導出されるq-ガウス分布が,マルチフラクタルなどのモデルの表現に効果的であることが示されている.q-ガウス分布は,q値により分布の裾の長さを変化させることができ,2次よりも高次なモーメントを調節できるため,外れ値に対する頑健性の向上が期待される.そこで,本研究では,q-ガウス分布の混合モデルであるq-混合ガウス分布を提案し,映像と画像のセマンティックインデクシングにおけるその有用性を示す.評価実験は,TRECVID 2010 Semantic IndexingデータセットとPASCAL VOC 2010 データセットで行い,評価尺度のMean Average Precision はそれぞれのデータセットで,10.9%,49.4%となり,通常のGMMを用いた場合よりも高い精度を示した
2012-08-26