シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別(画像・映像処理)
スポンサーリンク
概要
- 論文の詳細を見る
スポーツ映像から特定シーンを効率良く検索する技術の実現が強く望まれている.我々は,シンボル列化したシーンの離散HMMを用いた学習による,野球映像の各シーンのプレイ種識別手法を提案した.しかし,出塁及びアウトカウント増加の起こる7種の「打席完了」プレイ種のみを識別対象としていたため,打席の完了しないプレイ種(投球のみ,ファウル,牽制及び盗塁)を識別対象に加えた場合,十分な識別精度が得られなかった.そこで本論文では,我々の従来手法に対し,新しく2種の「プレイ種相関度」を識別尺度として加えた野球映像のプレイ種識別手法を提案する.プレイ種相関度の一つは,シンボル列を構成するシンボルの中の「代表シンボル」の出現頻度に関するものであり,シンボル列全体ではなく個々のシンボルに注視した特定プレイ種との相関の強さを表す.もう一つは,投球ショット間隔に関するものであり,投球ショット間隔の長さのプレイ種との相関の強さを表す.学習用シーンのシンボル列を学習したHMMによるプレイ種ごとの出力ゆう度と,2種のプレイ種相関度を重み指数を付加して掛け合わせて各プレイ種の総合的なゆう度を算出し,識別を行う.そして本論文では,MLB放送映像を用いた実験により,打席完了プレイ種だけでなく,打席の完了しないプレイ種を含めた11のプレイ種を従来手法よりも高い精度で識別可能であることを示す.
- 2010-06-01
著者
-
篠田 浩一
東京工業大学情報理工学研究科計算工学専攻
-
篠田 浩一
東京工業大学
-
篠田 浩一
東京工業大学大学院情報理工学研究科計算工学専攻
-
藤井 真人
NHK放送技術研究所
-
酒井 善則
東京工業大学
-
望月 貴裕
NHK(日本放送協会)放送技術研究所
-
藤井 真人
NHK(日本放送協会)放送技術研究所
-
望月 貴裕
NHK放送技術研究所
-
酒井 義則
東京工業大学理工学研究科集積システム専攻
-
酒井 善則
東京工業大学大学院理工学研究科
-
酒井 善則
東京工業大学大学院理工学研究科集積システム専攻
-
篠田 浩一
NEC情報通信メディア研究本部
-
酒井 善則
東京工業大学理工学研究科集積システム専攻
-
望月 貴裕
日本放送協会放送技術研究所人間・情報科学研究部
関連論文
- シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別(画像・映像処理)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出 (医用画像)
- ニュース映像の役割を考慮した視覚的連想サマリシステムの検討(高精細画像の処理・表示,および一般)
- ニュース映像の役割を考慮した視覚的連想サマリシステムの検討(高精細画像の処理・表示,及び一般)
- SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出(テーマセッション関連,一般物体認識・画像特徴量)
- ロボットカメラ制御のための撮影テクニック機械学習
- メタデータ制作フレームワーク (コンテンツ活用技術 特集号)
- サッカー放送映像のフォーメーションデータ高速生成手法とデータ提示およびシーン検索の提案(ITS画像処理,映像メディア,視覚および一般)
- 3次元形状手がかりに基づく陰影からの表面反射特性知覚(ヒューマンインフォメーション)
- CHLAC特徴と隠れマルコフモデルを用いたGait認識(一般セッション2,複合現実感のためのパターン認識・理解)
- 統計的モデル選択によるシーン数の自動推定を用いた動画要約(一般セッション3,複合現実感のためのパターン認識・理解)
- 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化
- 音声とペン入力の同時入力に対する認識方式の検討(認識・理解・対話・一般)
- H-007 検索技術を使う新しいテレビ視聴スタイルCurioView(画像認識・メディア理解,一般論文)
- ゴルフ中継での放送カメラを用いたティーショット軌道表示システム(画像認識,コンピュータビジョン)
- RI-003 サッカー選手配置取得のための選手追跡と選手認識の確率的統合法(グラフィクス・画像,査読付き論文)
- 遮蔽とノイズのある二次元観測データから三次元顔特徴点推定の一検討(一般,膨大なデータから学ぶもの)
- D-12-9 サッカー選手配置推定のための顔・背番号認識と選手追跡の統合法(D-12. パターン認識・メディア理解,一般セッション)
- 数値列化したイベントシーンの学習と試合進行状況情報による制約条件を用いた野球映像イベント識別(パターン認識・メディア理解のための学習理論とその周辺)
- 人物軌跡に基づく混雑映像からの特定行動検出 (ヒューマン情報処理)
- 放送カメラを用いたティーショット軌道表示システム--オブジェクト抽出・追跡技術のゴルフ中継への応用
- 投球軌道と捕手の動作特徴に基づく野球の球種識別(一般セッション1)
- 投球軌道と捕手の動作特徴に基づく野球の球種識別(一般セッション1,CV/PR技術のVRへの応用)
- 基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識(聴覚・音声・言語とその障害,一般)
- 音声と手書き文字の同時入力インターフェース(マルチモーダル, コーパス・言語モデル)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別
- 音響モデル学習のための相対エントロピーを用いた学習文選択
- 大規模映像資源のためのマルチモーダル高次特徴検出
- 音声と手書き文字の同時入力インターフェース(マルチモーダル, コーパス・言語モデル)
- ハーモニック・クラスタリングによる多重音の基本周波数推定アルゴリズム
- カテゴリ推定に基づく動的な言語モデル適応
- 大規模映像資源のためのマルチモーダル高次特徴検出(画像・映像処理)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 会議音声認識のためのスペクトル減算に基づくオンライン音源分離(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- 木構造クラスタリングを用いた動画像からの高次特徴抽出(一般セッション1,文字・文書の認識・理解)
- D-14-7 手書き文字の準同期入力を併用した音声認識手法の予備検討(D-14. 音声・聴覚)
- 2. 統計的手法を用いた音声モデリングの高度化とその音声認識への応用(音声情報処理技術の最先端)
- SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 投球の次ショットに重きを置いたシーンのパターン化と離散隠れマルコフモデルを用いた野球放送映像の自動イベント分類
- 隠れマルコフモデルを用いた野球放送の自動的インデクシング(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 隠れマルコフモデルを用いた野球放送の自動的インデクシング(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 会議音声認識のためのスペクトル減算に基づくオンライン音源分離(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 会議音声認識のためのスペクトル減算に基づくオンライン音源分離(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 事後確率最大化手法を用いた言語モデルの学習
- マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング (パターン認識・メディア理解)
- 確率モデルによる多声楽曲MIDI演奏からの楽譜推定
- 音声認識のための複数の認識器を利用した能動学習(音響モデル,第11回音声言語シンポジウム)
- 音声認識のための複数の認識器を利用した能動学習
- 講義音声認識における講義スライド情報の利用(第8回音声言語シンポジウム)
- 講義音声認識における講義スライド情報の利用(Session-6 音声認識,第8回音声言語シンポジウム)
- ハイブリッドモデルに基づく単視点ビデオデータにおける人間の歩行動作のトラッキング
- ハイブリッドモデルに基づく単視点ビデオデータにおける人間の歩行動作のトラッキング (コンシューマエレクトロニクス・メディア工学)
- 講義音声認識における講義スライド情報の利用(Session-6 音声認識,第8回音声言語シンポジウム)
- 講義音声認識における講義スライド情報の利用
- 雑音下音声におけるスペクトル縮小の分析とその耐雑音音声認識への利用
- ビデオ画像における人間の歩行動作の3次元トラッキング(テーマセッション(1),人の検出・計測・認識)
- ビデオ画像における人間の歩行動作の3次元トラッキング(テーマセッション(1),人の検出・計測・認識)
- マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング(テーマセッション,映像処理とTRECVID)
- 映像解析・検索評価ワークショップTRECVID2010の概要(テーマセッション,映像処理とTRECVID)
- 雑音下音声におけるスペクトル縮小の分析とその耐雑音音声認識への利用(音声一般,聴覚・音声・言語とその障害/一般)
- 木構造GMMを用いたセマンティックインデクシングの高速化(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 木構造GMMを用いたセマンティックインデクシングの高速化(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- D-12-120 動的特徴量を用いたHMMによる連続動作認識(D-12. パターン認識・メディア理解B)
- クラウド時代の新しい音声研究パラダイム
- 複数ピンマイクで収音された会議音声の重畳区間検出
- GMM-SupervectorとSVMを用いた映像からのイベント検出 (音声)
- GMM-SupervectorとSVMを用いた映像からのイベント検出 (パターン認識・メディア理解)
- 音声認識におけるモデル間スケーリング係数の自動推定(音声,聴覚)
- 映像の高性能なセマンティックインデクシングを目指して(テーマセッション,実世界文字認識と理解)
- 音声認識における転移学習 : 話者適応(知識の転移)
- 手話素単位を用いた大語彙手話認識(テーマセッション,時系列パターン認識)
- 手話素単位を用いた大語彙手話認識(テーマセッション,時系列パターン認識)
- GMM-SupervectorとSVMを用いた映像からのイベント検出(テーマセッション,時系列パターン認識)
- GMM-SupervectorとSVMを用いた映像からのイベント検出(テーマセッション,時系列パターン認識)
- 固定監視カメラからの人混み中の行動イベント検出(実世界センシングとその応用)
- 固定監視カメラからの人混み中の行動イベント検出(実世界センシングとその応用)
- 映像検索技術の新たな潮流
- 音声認識におけるモデル間スケーリング係数の自動推定
- GMM-Supervector とSVMを用いた映像からのイベント検出
- 手話素単位を用いた大語彙手話認識
- 音声認識における転移学習 : 話者適応
- 映像のセマンティックインデクシングのためのq-混合ガウス分布
- GMM-Supervector とSVMを用いた映像からのイベント検出
- 映像検索技術の新たな潮流
- 「音声認識」は今後こうなる!
- 映像のセマンティックインデクシングのためのq-混合ガウス分布(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- 話者認識技術の現状と課題(オーガナイズドセッション(パネルディスカッション),音声アプリケーション,一般)
- カメラの動き補正に基づく時空間特徴量とGMM supervectorを用いた映像からのイベント検出(テーマセッション,大規模データベースとパターン認識)
- 映像のセマンティックインデクシングのためのq一混合ガウス分布(コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- コミッティに基づく能動学習・半教師付き学習を用いた音声モデル
- GMM Supervectorとビデオクリップスコアを用いた映像のセマンティックインデクシング(テーマセッション,大規模データベースとパターン認識)