HMMを用いたMPEGデータからの動画像検索の検討
スポンサーリンク
概要
- 論文の詳細を見る
MPEGのDCT係数とHMMを利用した、動画像中の人物動作の認識・検索のための手法を提案した。DCT係数はKL展開の近似であり、周波数空間の特徴を抽出している点で、画像認識への有効性が期待できる。またHMMは、時系列パターンの認識、特に音声認識で広く利用されており、動画像の認識・検索へも有効である。今回、前処理後のMPEGデータからDCT係数を特徴量としで使用し、HMMによる動作認識系を用いて、DCT係数の識別特徴としての有効性を、テニス動作の画像を例として評価した。DCT係数を低次成分から順次特徴量として使用し、識別性能を比較した。対象画像サイズが小さい時でも、DCT係数の高次の項まで使用することにより、高い識別率が実現できることを示した。また検索への応用例として、連続した動作画像シーケンスでの尤度評価実験を行った。
- 社団法人電子情報通信学会の論文
- 1996-06-27
著者
-
大和 淳司
Nttコミュニケーション科学基礎研究所
-
村瀬 洋
NTT基礎研究所
-
大和 淳司
NTTヒューマンインタフェース研究所
-
大和 淳司
日本電信電話(株)第三部門
-
大和 淳司
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- メモリベースパーティクルフィルタ : 状態履歴に基づく事前分布予測を用いた頑健な対象追跡(画像映像解析,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 色を忠実に再現する高精細分光画像撮影技術 (特集 「見る・見せる」技術の最先端)
- 頭部姿勢の変動に頑健な表情認識技術--表情から人の気持ちを読み取ることを目指して
- パーティクルフィルタとこう配法の組合せによる頭部姿勢と表情の同時推定(メディア処理,画像の認識・理解論文)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 複数人会話における非言語インタラクション構造の推定--誰が誰にどのように反応しているか?
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3)
- 第13回パターン認識国際会議 (13th ICPR) 報告
- 適応型混合テンプレートを用いた音源同定 : 音楽演奏への適用
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- 大面積圧力センサを用いた歩行パタ-ン計測装置の開発
- 260. 大面積足圧センサによる脳卒中片麻痺患者およびパーキンソン病患者の歩行分析
- 局所色情報を用いた高速物体探索 : アクティブ探索法
- アクティブ視点制御の効果と物体形状について
- 動画像からの笑い表情の認識法に関する一検討 : 目・口の動き開始時期の検出
- 照明光の変動にロバストな画像からの物体抽出
- アクティブ視点制御による輪郭からの形状復元
- 古くて新しい画像認識法 : 固有空間法による画像認識
- 遮蔽輪郭からの形状復元のためのアクティブ視点制御
- 最近のコンピュータービジョンの動向
- CVCV-WG特別報告 : コンピュータビジョンにおける技術評論と将来展望(VI) : 固有空間法による画像認識
- 局所的色交差法によるContent Based Retrieval
- 多重解像度と固有空間表現による3次元物体のイメージスポッティング
- 2次元照合による3次元物体認識 : パラメトリック固有空間法
- 2次元照合を用いた物体の位置検出と追跡
- 2次元照合による3次元物体の認識とその学習 : パラメトリック固有空間表現
- シルエットを用いた歩行動画像からの個人識別
- 入店客計数のためのシルエット・足音・足圧による男女識別法
- モルフォロジー処理によるパターンスペクトルを特徴量に用いた男女識別法
- 9.大面積足圧センサーシステムによる歩行分析(その他の脳疾患)
- 13-6 大面積圧力画像センサを用いた歩行解析
- 278. 大面積足圧センサによる歩行分析
- 複数センサ情報の統合による男女識別
- モルフォロジーによるパターンスペクトラムを用いた服装識別
- 圧力センサマットを用いた足圧画像からの個人識別の検討
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 局所色情報を用いた高速物体探索 : アクティブ探索法
- 動作認識のための状態遷移モデル : HMMの高度化と非HMM手法の成長(「時系列データの認識 : HMMを越えて」)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 適応的領域分割と閾値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 適応的領域分割と闘値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- テンプレート学習による本棚画像中の文字認識
- 複数情報が重畳した尺八譜認識に関する一検討
- 周囲文字を含んだ参照パターンによる本棚画像中の文字認識
- 辞書の自動選択による本棚画像中の文字認識
- 複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
- 複数人物の対面会話を対象としたマルコフ切替えモデルに基づく会話構造の確率的推論(ヒューマンインタフェース基礎)
- 5B-3 家庭用ロボットのための触覚インタフェース
- D-12-3 色ヒストグラムを用いた実環境物体探索に関する一検討
- MIT人工知能ラボ研究レポ-ト(最終回)知能ロボット(2)ヒュ-マノイドプロジェクト
- MIT人工知能ラボ研究レポ-ト(2)知能ロボット(1)
- MIT人工知能ラボ研究レポ-ト--インテリジェントル-ム
- 人と機械のインタラクションにおける画像技術 (メディア工学)
- Support Vector Machineカーネル非線形部分空間法
- エージェントとロボットによるユーザ行動への影響評価
- 変動輝度テンプレートによる頭部姿勢と表情の同時推定
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- Robust Character Recognition Using Adaptive Feature Extraction Method
- Basic Design of Video Communication System Enabling Users to Move Around in Shared Space
- H-036 Subtle Facial Expression Recognition Based on Expression Category-dependent Motion Magnification
- HMMを用いたMPEGデータからの動画像検索の検討
- カテゴリー別VQを用いたHMMによる動作認識法
- 隠れマルコフモデルを用いた動画像からの人物の行動認識
- HMMを用いた動画像からの動作認識の高精度化と評価
- マルチモーダルアクティブ探索を用いた画像・音響時系列の高速探索
- ヒストグラム特徴系列に基づく長時間音響信号の高速探索
- パート譜を用いたボーカル音 分離システム
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 姿勢とアピアランスの変化に頑健な対象追跡を実現するアピアランス統合メモリベースパーティクルフィルタ(画像・映像解析,第13回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (マルチメディア情報ハイディング・エンリッチメント)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (画像工学)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (ライフインテリジェンスとオフィス情報システム)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 発話行為の定量的分析に基づくコミュニケーションシステム評価法 : 顔向きの情報をサポートするVMCシステムの比較評価(コミュニケーション支援,一般)
- 発話行為の定量的分析に基づくコミュニケーションシステム評価法 : 顔向きの情報をサポートするVMCシステムの比較評価(コミュニケーション支援,一般)
- 複数人対話を対象とした表情と視線に基づく共感/反感の推定モデルとその評価 : 対話者間に生まれる感情をいかに理解するか?(顔とコミュニケーション)
- 身体尺から見直すタッチパネル・インタフェースハードウェアの模倣からソフトウェアの柔軟さ
- ビデオ通信環境における対人印象に関する探索的研究 : 当事者評価と傍観者評価の比較(コミュニケーションの心理及び一般)
- ビデオ通信環境における対人印象の規定因に関する探索的実験研究 : 第三者に対する映像呈示と音声呈示の比較(コミュニケーション(技術),「身体,あそび,コミュニケーション」及びコミュニケーション一般)
- ビデオ通信環境における対人印象に関する探索的研究 : 当事者評価と傍観者評価の比較
- 複数人会話シーン分析の研究と今後の展望(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
- 視線一致範囲測定に関する探索的検討 : 疎らな実験データの解析(『場のデザイン』及びコミュニケーション一般)
- アイコンタクト知覚範囲の性差に関する探索的検討 : 社交性不安およびアイコンタクト相手の性別の影響(顔、表情の認知・理解,コミュニケーションの心理及び一般)
- ビデオ通信環境における対人印象の規定因に関する探索的実験研究第三者に対する映像呈示と音声呈示の比較