Bag-of-Framesと時空間特徴量を用いたSemantic Indexing Taskへの取り組み(テーマセッション,映像処理とTRECVID)

スポンサーリンク

概要

論文の詳細を見る
本発表では,国際映像処理ワークショップTRECVID 2010で行われた概念索引タスク(Semantic Indexing Task)への取り組みの結果について報告する.映像中のショット動画の全フレームから特徴を抽出し,ベクトル量子化された各フレームの特徴量を要素とするBag-of-Framesを特徴量として利用した.加えて,時空間特徴,顔特徴など10種類の特徴量を抽出し,Multiple Kernel Learning(MKL)によって統合する動作認識フレームワークを用い,Airplane, Boatなど130種類の概念の認識を行った.その代表の30種類の概念についてテストした結果,MKLによる統合による結果で平均適合率infAP=0.0478を得た,これはTRECVID2010の参加者30チームの内,14位に当たる.また,10種類の概念(light category)においては37チームの内,12位となった.
2011-02-10

著者

関連論文

もっと見る

スポンサーリンク