言語と画像の情報統合によるスポーツ映像からの人物・アクション・イベントの抽出
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, テレビやビデオ映像などの連続メディアの有効利用のために, 映像の意味内容に基づいたアノテーションの自動生成を試みる.まずクローズドキャプション(CC)と呼ばれる言語情報からドメイン知識とキーワード列の利用により, 映像に対してストーリー上重要な意味を持つと考えられる部分を抽出した上で, 各部分での人物・アクション・イベントに関する情報を抽出する.次に画像情報に対しても同様に分割し, プレイに関する情報を抽出する.最後にこれらの時間的同期をとり, それぞれの結果を組み合わせた人物・プレイ情報を映像にアノテーションとしてつける.本手法を実際のスポーツ映像に対し適用した結果を提示し, 考察を行う.
- 2000-03-16
著者
-
新田 直子
大阪大学 大学院工学研究科
-
北橋 忠宏
大阪大学産業科学研究所
-
馬場口 登
大阪大学産業科学研究所
-
新田 直子
大阪大学産業科学研究所
-
北橋 忠宏
関西学院大学
-
北橋 忠弘
大阪大学産業科学研究所
関連論文
- スポーツ映像の検索
- D-12-15 サーベイランス映像における出現頻度を考慮した不審物体の検出(D-12. パターン認識・メディア理解,一般セッション)
- 事例に基づく映像ショット列への音楽付与 (マルチメディア・仮想環境基礎)
- 事例に基づく映像ショット列への音楽付与 (音声)
- 事例に基づく映像ショット列への音楽付与 (パターン認識・メディア理解)
- 事例に基づく映像ショット列への音楽付与 (コミュニケーションクオリティ)
- テレビ視聴行動からの個人的選好獲得(一般セッション5)
- テレビ視聴行動からの個人的選好獲得(一般セッション2,三次元画像,多視点画像)
- 手書き線画を用いた定性的3次元形状入力のための立体復元の一手法
- 直交性に基づく線画の定性的3次元形状復元
- MIRU2008若手プログラム報告(一般セッション5,移動カメラ画像処理におけるパターン認識とメディア理解)
- 適合性フィードバックを用いた顔の経年変化を含む人物画像検索(一般セッション5,コンピュータビジョンとパターン認識のための学習理論)
- インターモーダル協調によるアメリカンフットボール映像の自動パーシング(マルチメディアとパターン認識理解,一般)
- 適合性フィードバックを用いた顔の経年変化を含む人物画像検索(一般セッション5)
- 自然言語案内文の三次元経路モデルによる表示
- 地図道路構造のモデル化とそれに基づく略地図と案内文の生成
- 経路理解モデルに基づく略地図と案内文の生成手法
- 地図情報の取捨選択による経路理解の向上の一手法
- 地図画像情報システムにおけるインタラクティブ経路生成とその略地図生成への応用
- D-12-93 映像編集支援のための事例映像に基づいたショットからの編集区間抽出(D-12.パターン認識・メディア理解,一般講演)
- データ工学とメディア理解との融合 : 大量データにおけるパターン情報を扱う新しい枠組みは?(テーマセッション(1),データ工学とメディア理解との融合)
- D-12-40 共起人物を考慮した人物画像検索(D-12.パターン認識・メディア理解,一般セッション)
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援 (ヒューマン情報処理)
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援 (パターン認識・メディア理解)
- ビデオアノテーション
- DS-3-3 可逆型プライバシー保護画像処理(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- 観測型実世界コンテンツ : ディジタルジオラマ(センシングウェブ)
- 部分映像挿入による時間軸上の映像補完
- 部分映像挿入による時間軸上の映像補完
- 映像編集のための事例学習に基づく素材映像からのショット列生成(一般セッション5)
- D-12-80 イメージモザイキングを用いた仮想カメラワークの生成(D-12. パターン認識・メディア理解,一般セッション)
- D-12-66 オブジェクト同定のための照明変動を考慮したSIFT特徴量の洗練化(D-12. パターン認識・メディア理解,一般セッション)
- RFIDタグとカメラ映像を用いたサーベイランス映像中の人物同定(日本語セッション1,第二回日韓パターン認識ワークショップ(KJPR))
- D-12-102 プライバシー保護機能を有する映像サーベイランスシステムPriSurvにおける人物同定(D-12.パターン認識・メディア理解,一般講演)
- 放送型スポーツ映像の意味内容獲得のためのストーリー分割法(マルチメディアパターン処理)
- スポーツ映像の構造を考慮した意味内容記述モデルと自動ストーリー分割法
- 音声・言語・映像の協調的処理によるスポーツ映像からのイベント検出
- 放送型スポーツ映像の構造を考慮した重要シーンへの自動アノテーション付け (画像の認識・理解論文特集)
- 言語と画像の情報統合によるスポーツ映像からの人物・アクション・イベントの抽出
- 言語と画像の情報統合によるスポーツ映像からの人物・アクション・イベントの抽出
- ビデオデータにおける音声とクローズドキャプションの同期手法の検討
- インターモーダル協調による映像メディアからのイベント抽出
- インターモーダル協調を用いた連続メディアの内容解析
- 座談会 「人工知能研究の現状と問題点」
- マルチエージェントシステムを利用した文字領域抽出法
- 文書画像からの文字領域の協調的抽出法
- コスト最小化による2次元画像からの文字領域抽出
- カラー画像の会話型領域分割
- D-12-46 プライバシー保護を考慮した3D屋内環境可視化システム(D-12. パターン認識・メディア理解,一般セッション)
- D-11-130 情報ハイディングを利用した可逆型プライバシー保護画像処理(D-11. 画像工学,一般セッション)
- D-12-101 プライバシー保護機能を有する映像サーベイランスシステムPriSurvにおける前景抽出(D-12.パターン認識・メディア理解,一般講演)
- D-12-100 プライバシー保護機能を有する映像サーベイランスシステムPriSurvにおけるポリシー制御(D-12.パターン認識・メディア理解,一般講演)
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援(一般,顔・人物・ジェスチャ・行動)
- 座談会 人間の知能と機械の知能 : 1986年9月6日 於:北海道大学
- テレビ視聴行動からの個人的選好獲得(一般セッション2,三次元画像,多視点画像)
- 個人的選好獲得のための特定人物のテレビ視聴時における興味区間推定(マルチメディア応用,画像の認識・理解論文)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- 対話における文脈の定式化と文脈処理の枠組み
- 対話参加者の知識状態を用いた省略語の補充
- 対話構造解析における話題の認識
- 優先度つきトークンパッシングプロトコルを用いた分散型探索機構
- RK-006 固定カメラに対する周辺情報を考慮したズーム映像の生成(教育工学・福祉工学・マルチメディア応用,査読付き論文)
- 3J-6 Web上のニュース記事の分類における知識コンバージョンを用いた例外処理
- 幾何学的拘束に基づく物体認識へのコネクショニスト・アプローチ
- 2009年PRMUアルゴリズムコンテスト : 「クローンを探せ!」実施報告と受賞アルゴリズム紹介(一般セッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 自然言語を用いた対話形式による文書検索における事典情報の利用
- 知識ベースに基づく対話管理における知識管理方法
- PriSurv:プライバシー保護機能を有する映像サーベイランスシステム
- 個人的選好獲得システムの構築--テレビ視聴者の同定と興味区間の推定
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援(一般,顔・人物・ジェスチャ・行動)
- RK-007 事例映像に基づくシーンに対する適応的音楽選択(教育工学・福祉工学・マルチメディア応用,査読付き論文)
- Video surveillance system for community spaces (パターン認識・メディア理解)
- 事例に基づく映像ショット列に対する音楽ミキシング (パターン認識・メディア理解)
- データ工学とメディア理解との融合 : 大量データにおけるパターン情報を扱う新しい枠組みは?(テーマセッション(1),データ工学とメディア理解との融合)
- 疎分散カメラ間の人物グループの対応付けによる人流解析 (パターン認識・メディア理解)
- 映像編集のための事例学習に基づく素材映像からのショット列生成(一般セッション2,三次元画像,多視点画像)
- 映像編集のための事例学習に基づく素材映像からのショット列生成(一般セッション2,三次元画像,多視点画像)
- 個人的選好獲得システムの構築--興味区間抽出・興味度推定・プロファイル作成 (特集 画像と放送)
- J-031 可変幅量子化型DWT変換を用いた電子透かしによる改ざん種類推定(J分野:グラフィクス・画像)
- テレビ視聴環境における個人的選好獲得のための視聴区間推定(一般セッション(1), ユビキタスメディアの将来展望)
- テレビ視聴環境における個人的選好獲得のための視聴区間推定(一般セッション(1), ユビキタスメディアの将来展望)
- I-014 個人的選好獲得のための選択的人物同定によるテレビ視聴区間推定(I分野:画像認識・メディア理解)
- D-12-90 スライドショー生成のための事例に基づく画像選択(D-12.パターン認識・メディア理解,一般セッション)
- テロップ消去のための時空間特徴を用いた映像修復
- コミュニティ空間を対象とした映像サーベイランスシステム(一般セッション,文字・文書の認識と理解)
- 事例に基づく映像ショット列に対する音楽ミキシング(一般セッション,文字・文書の認識と理解)
- 適合性フィードバックを用いた映像パケットのインタラクティブクラスタリング(映像メディア処理, 画像の認識・理解論文)
- 疎分散カメラ間の人物グループの対応付けによる人流解析(一般セッション,文字・文書の認識と理解)
- 映像編集支援のための事例映像における音と動画の同期パターン解析(テーマセッション(3),データ工学とメディア理解との融合)
- 映像編集支援のための事例映像における音と動画の同期パターン解析(テーマセッション(3),データ工学とメディア理解との融合)
- J-025 編集映像における動画と音ストリームのリズム同期について(J分野:グラフィクス・画像)
- LI-19 放送型スポーツ映像の構造解析に基づく意味内容情報の獲得(I. 画像認識・メディア理解)
- 画像処理 事例に基づく映像シーンに対する音楽ミキシング
- D-12-33 コミュニティに基づく画像コレクションの構造化(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-12-30 イベントの画像特徴パターンを用いた画像に対するタグ付与(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-4-4 発信源の局所性に基づくツイートからのローカル語の抽出(D-4.データ工学,一般セッション)
- D-12-192 言語情報による連続メディアからの人物オブジェクトとアクションの抽出