マルチフレーム認識を用いた動画像認識の分析

概要

論文の詳細を見る
本研究は,近年に提案されたマルチフレーム手法のショット認識に対する有効性の検証が目的である.TRECVID2010 の実験データから SURF,色特徴,時空間特徴を抽出し,それらを Bag-of-Features 表現に変換する.この際,1 枚のキーフレームのみから特徴を抽出を行う従来手法とは異なり,マルチフレーム処理として動画から複数のフレームを取得して特徴を抽出し,統合することで一つの特徴ベクトルを生成した.実験では TRECVID のタスクで指定されている五つの概念を対象とし,キーフレームのみの認識との比較を行った.さらにフレーム取得枚数や選択方法を変化させたときの認識率の変化も検証した.実験の結果,キーフレームのみの認識に比べて SVM で学習,分類をした場合は認識率が最大で 700% 上昇し,MKL-SVM で学習,分類をした場合は最大で 883% 上昇した.TRECVID2010 の全チームの平均値と比較した結果,MKL-SVM で学習,分類をした場合に全クラスで値を上回った.
2011-05-12