カメラの動き補正に基づく時空間特徴量とGMM supervectorを用いた映像からのイベント検出(テーマセッション,大規模データベースとパターン認識)

概要

論文の詳細を見る
この研究では、大量のインターネット映像の中から、対象のイベントを検出するイベント検出を目的とする。ここでの「イベント」は、「誕生日会」や「乗り物のタイヤ交換」など、いくつかの動作や物体の組み合わせで構成される事象を指す。イベント検出を対象とした多くの研究では、局所特徴抽出と特徴量のモデル化による手法が用いられている。特徴量の中でも、動作を表す時空間特徴量がイベント検出に効果的であることが示されているが、カメラの動きに対して頑健でないという問題がある。本論文では、この問題に対し、オプティカルフローによるカメラの動き推定とその補正を適用した時空間特徴量を提案する。この特徴量を含む、相補的な特徴量をそれぞれGMM supervectorによってモデル化し、SVMの入力として用いることでイベント検出を行う。TRECVID2012 Multimedia Event Detectionタスクで、Mean Normalized Detection Cost O.5296となり、参加17機関中3番目の精度であった。
2013-02-14