Bag-of-Framesと時空間特徴量を用いたSemantic Indexing Taskへの取り組み(テーマセッション,映像処理とTRECVID)
スポンサーリンク
概要
- 論文の詳細を見る
本発表では,国際映像処理ワークショップTRECVID 2010で行われた概念索引タスク(Semantic Indexing Task)への取り組みの結果について報告する.映像中のショット動画の全フレームから特徴を抽出し,ベクトル量子化された各フレームの特徴量を要素とするBag-of-Framesを特徴量として利用した.加えて,時空間特徴,顔特徴など10種類の特徴量を抽出し,Multiple Kernel Learning(MKL)によって統合する動作認識フレームワークを用い,Airplane, Boatなど130種類の概念の認識を行った.その代表の30種類の概念についてテストした結果,MKLによる統合による結果で平均適合率infAP=0.0478を得た,これはTRECVID2010の参加者30チームの内,14位に当たる.また,10種類の概念(light category)においては37チームの内,12位となった.
- 2011-02-10
著者
-
柳井 啓司
電気通信大学大学院情報工学専攻
-
柳井 啓司
電気通信大学電気通信学部情報工学科
-
柳井 啓司
電気通信大学
-
野口 顕嗣
電気通信大学
-
野口 顕嗣
電気通信大学大学院総合情報学専攻
-
柳井 啓司
電気通信大学大学院総合情報学専攻
-
下田 保志
電気通信大学大学院総合情報学専攻
関連論文
- 単語概念の視覚性と地理的分布の関係性の分析 (画像の認識・理解論文特集)
- 佐藤真一,齋藤淳著, 石頭なコンピュータの眼を鍛える-コーパスで人間の視覚にどこまで迫れるか-, 丸善ライブラリー378(新書), 2009.12
- Multiple Kernel Learningによる50種類の食事画像の認識 (画像の認識・理解論文特集)
- 単語概念の視覚性と地理的分布の関係性の分析(パターン認識応用,画像の認識・理解論文)
- サポートベクターマシン関連ツール SVMLight, LIBSVM, SHOGUN
- Multiple Kernel Learningによる50種類の食事画像の認識(パターン認識応用,画像の認識・理解論文)
- セマンティックギャップを越えて : 画像・映像の内容理解に向けて
- 一般物体認識(チュートリアル,一般物体認識・画像特徴量)
- 物体認識技術の進歩
- 画像特徴とテキスト特徴を用いたWebスポーツニュース画像のイベント分類(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- 画像特徴とテキスト特徴を用いたWebスポーツニュース画像のイベント分類(テーマ関連セッション3)
- 大規模位置情報付き画像データベースを用いた特定単語に対する世界各地の代表的な画像の発見(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- Web画像ニュースの顔と人物名の対応付け(卒論セッション)
- Multiple Kernel Learningを用いた食べ物画像の分類(テーマ関連セッション2,コンピュータビジョンとパターン認識のための学習理論)
- TRECVID高次特徴抽出タスクにおける多種類特徴統合手法の比較(テーマ関連セッション3,コンピュータビジョンとパターン認識のための学習理論)
- Bag-of-Features表現を用いたエントロピーによる単語の視覚性の分析(テーマ関連セッション7,コンピュータビジョンとパターン認識のための学習理論)
- VisualRankにおける位置情報活用の検討(テーマセッション関連,一般物体認識・画像特徴量)
- Bag-of-Features表現を用いたエントロピーによる単語の視覚性の分析(テーマ関連セッション7)
- Multiple Kernel Learningを用いた50種類の食事画像分類
- TRECVID高次特徴抽出タスクにおける多種類特徴統合手法の比較(テーマ関連セッション3)
- Multiple Kernel Learningを用いた食べ物画像の分類(テーマ関連セッション2)
- カメラが情景を理解する : シーンの意味的分類技術の最先端(次世代ディジタルカメラ/ディジタルムービーを予測する 第7回)
- 6R-3 多種類特徴の統合による大規模映像認識(マルチメディア処理,学生セッション,データベースとメディア)
- 画像・映像の認識と意味的検索(認識,理解,対話,一般)
- 位置情報付き路上画像の撮影方向推定システムの提案
- Web上の大量画像を用いた特定物体認識手法による一般物体認識
- Web動画ショットの動作分類のための時空間特徴抽出手法の提案
- 多種類特徴統合による動作認識手法の提案(テーマ関連,顔・人物・ジェスチャ・行動)
- 多種類特徴統合による動作認識手法の提案(テーマ関連,顔・人物・ジェスチャ・行動)
- ジオタグ画像認識における周辺テキスト情報の有効性の検証
- 一般物体認識における機械学習の利用(特別セッション,機械学習とその応用)
- 位置情報付き路上画像の撮影方向推定システムの提案
- Folksonomyによる階層構造画像データベースの構築
- 撮影位置の情報を用いた一般画像認識の可能性の検討(卒論セッション・概要発表)
- 6R-5 Earth Mover's Distanceを用いた類似Web動画検索(マルチメディア処理,学生セッション,データベースとメディア)
- World Wide Web Conference 2003(会議レポート)
- Bag-of-keypointsによるTRECVIDデータに対する映像認識(卒論セッション)
- Bag-of-Keypoints表現を用いたWeb画像分類(卒論セッション)
- 色,動き,顔特徴に基づくTRECVIDラッシュ映像の自動要約(卒論セッション・概要発表)
- 対局盤面と解説盤面の認識結果の統合による囲碁対局テレビ番組からの対局棋譜生成(文書・文字メディアの認識・理解, 一般)
- 対局盤面と解説盤面の認識結果の統合による囲碁対局テレビ番組からの対局棋譜生成(文書・文字メディアの認識・理解, 一般)
- 対局盤面と解説盤面の認識結果の統合による囲碁対局テレビ番組からの対局棋譜生成
- 対局盤面と解説盤面の認識結果の統合による囲碁対局テレビ番組からの対局棋譜生成
- 囲碁対局テレビ番組からの棋譜自動生成システム
- 反復深化探索に基づく協力詰将棋の解法
- 反復深化探索に基く協力詰将棋の解法
- PCクラスタを用いたWWWからの高速画像収集システム
- 6R-4 クラスタリングによるTRECVIDラッシュ映像の要約(マルチメディア処理,学生セッション,データベースとメディア)
- 一般物体認識の現状と今後(一般論文)
- 物体間の支持関係を利用した室内画像の認識 (画像の認識・理解論文特集)
- 確率的 Web 画像収集
- 一般物体認識のための単語概念の視覚性の分析(ユビキタスメディアによるセンサーネットワーク-インフラとしてのCV)
- 一般物体認識の現状と今後(テーマ関連/オーガナイズドセッション)
- 一般物体認識の現状と今後(テーマ関連/オーガナイズドセッション,事例ベースメディア解析)
- テキスト特徴と画像特徴を併用したWeb上の写真付きニュース記事のクラスタリング(テーマセッション(3),データ工学とメディア理解との融合)
- テキスト特徴と画像特徴を併用したWeb上の写真付きニュース記事のクラスタリング(テーマセッション(3),データ工学とメディア理解との融合)
- アリゾナ滞在記(グローバル・アイ)
- 一般物体認識のための単語概念の視覚性の分析(一般セッション1)
- 一般画像自動分類の実現へ向けた World Wide Web からの画像知識の獲得
- Web画像マイニングによる一般画像の自動分類 : 大量のWeb画像を用いた分類実験(PRMU一般セッション(2))(認識と学習,模倣学習)
- Web画像マイニングによる一般画像の自動分類 : 大量のWeb画像を用いた分類実験(PRMU一般セッション(2))(認識と学習,模倣学習)
- 地域別代表画像を用いた単語概念の地域性の分析
- マルチフレーム認識を用いた動画像認識の分析
- 候補領域推定による食事画像の複数品目認識
- Folksonomyを用いた画像特徴とタグ共起に基づく画像オントロジーの自動構築 (画像の認識・理解論文特集)
- 時空間特徴量を用いたYoutube動画からの特定動作ショットの自動抽出(テーマセッション,映像処理とTRECVID)
- Folksonomyを用いた画像特徴とタグ共起に基づく画像オントロジーの自動構築(物体認識,文字・文書,医用画像,画像の認識・理解論文)
- Bag-of-Framesと時空間特徴量を用いたSemantic Indexing Taskへの取り組み(テーマセッション,映像処理とTRECVID)
- Web画像収集における単語ベクトルの導入と画像特徴の改良
- Webマルチメディアと物体認識(特別講演,PRMUの拓く未来:Webスケール時代のパターン認識)
- 高解像度画像利用のためのマルチエージェントによる多重解像度画像理解システム
- マルチエージェントによる多重解像度画像理解システム
- 定性的モデル当てはめと空間推論による室内画像の認識
- WWWからの大量の収集画像を用いた画像認識の試み
- キーワードと画像特徴を利用したWWWからの画像収集システム
- キーワードと画像特徴を利用したWWWからの画像収集の試み
- Deformable Part Modelを用いた料理の位置検出(テーマセッション,実世界文字認識と理解)
- 候補領域推定に基づく複数品目食事画像認識(物体認識,文字・文書,医用画像,画像の認識・理解論文)
- 服飾画像マイニングのための衣類領域からの色情報抽出(インタフェース(2),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 服飾画像マイニングのための衣類領域からの色情報抽出(インタフェース(2),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 食材画像認識を用いたレシピ推薦システム(食メディア(1),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 食材画像認識を用いたレシピ推薦システム(食メディア(1),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 候補領域推定に基づく複数品目食事画像認識
- 4. 画像メディア技術の実世界データへの応用(大規模データを活用した映像メディア処理)
- I-060 人物画像における衣服領域の推定と色情報の抽出(画像処理応用,I分野:グラフィクス・画像)
- 複数品目が含まれる食事画像の認識における共起関係の利用(一般物体認識,文字・文書,映像,医用画像,画像の認識・理解論文)
- k-meansによる局所特徴量抽出と皿検出器による食事画像認識の改良(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- 視覚特徴およびタグ共起を用いた大規模Webビデオショットランキング(テーマセッション,大規模データベースとパターン認識)
- 服飾画像マイニングのための衣類領域からの色情報抽出
- 服飾画像マイニングのための衣類領域からの色情報抽出
- 食材画像認識を用いたレシピ推薦システム