モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))

スポンサーリンク

概要

論文の詳細を見る
本稿では,与えられた映像に適合するメタ情報を提示する映像認識(automatic video annotation)と,与えられたメタ情報に適合する映像を提示する映像検索(video retrieval)とを,統一的な枠組で取り扱う映像認識検索問題を取り上げ,そのための統計モデルである階層的トピック軌跡モデルHTTMを提案する.提案モデルは,各モダリティ及びクロスモーダルの共起関係を考慮したトピックモデルと,その時空間的ダイナミクスを表現する状態空間モデルとによって構成され,映像におけるインスタンス・シーン・コンセプトを階層的に表現する.このモデルに基づき,モデル推定・映像認識・映像検索それぞれを簡易に実現することが可能である.それと共に,音響信号や地理情報など他の要素を新規に導入する拡張も容易である.本稿では,人手によりラベル付けきれた映像データセットに対してこのモデルを用いた認識実験を行い,精度向上の結果とともに報告する.
2010-10-28

著者

関連論文

もっと見る

スポンサーリンク