MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
スポンサーリンク
概要
- 論文の詳細を見る
人間は、網膜に映る像の中から重要と思われる領域を瞬時に判断することで、効率的に情報を獲得している。これら高度な視覚機構を計算機上で実現することで、重要性に応じて映像中の情報を能動的に取捨選択でき、数多くのシステムをより高度化できる。本報告では、人間の視覚機構を高精度に模擬する新しい計算モデル、及び実時間動作を実現するstream processingに基づく実装方法を提案する。提案法では、新たにマルコフ連鎖モンテカルロ法に基づくサンプリングと、粒子フィルタに基づく事後確率推定を新たに導入することで、並列処理を実現可能とした。大規模視線測定データベースを用いた人間の注視行動との比較実験により、本提案手法が従来手法と比較して、10倍以上高速かつほぼ同精度で人間の映像注視行動を推定できることを示す。
- 2009-05-21
著者
-
大和 淳司
日本電信電話株式会社コミュニケーション科学基礎研究所
-
宮里 洸司
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
木村 昭悟
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
高木 茂
国立沖縄工業高等専門学校情報通信システム工学科
-
宮里 洸司
沖縄工業高等専門学校情報通信システム工学科
-
高木 茂
沖縄工業高等専門学校情報通信システム工学科
-
木村 昭悟
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
木村 昭悟
東京工業大学工学部電気電子工学科
-
高木 茂
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
大和 淳司
日本電信電話(株)第三部門
-
Yamato Junji
Ntt Communication Science Laboratories Ntt Corp.
-
Yamato Junji
Ntt Communication Science Laboratories Ntt Corporation
-
大和 淳司
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- メモリベースパーティクルフィルタ : 状態履歴に基づく事前分布予測を用いた頑健な対象追跡(画像映像解析,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 色を忠実に再現する高精細分光画像撮影技術 (特集 「見る・見せる」技術の最先端)
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 頭部姿勢の変動に頑健な表情認識技術--表情から人の気持ちを読み取ることを目指して
- パーティクルフィルタとこう配法の組合せによる頭部姿勢と表情の同時推定(メディア処理,画像の認識・理解論文)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 複数人会話における非言語インタラクション構造の推定--誰が誰にどのように反応しているか?
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3)
- 認識理解への認知発達的アプローチ (パターン認識・メディア理解)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- 動作認識のための状態遷移モデル : HMMの高度化と非HMM手法の成長(「時系列データの認識 : HMMを越えて」)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 適応的領域分割と閾値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 適応的領域分割と闘値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 複数人物の対面会話を対象としたマルコフ切替えモデルに基づく会話構造の確率的推論(ヒューマンインタフェース基礎)
- 背景差分法による物体検出を目的とした逐次モンテカルロ法による背景推定(画像・映像処理)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- グローバルな枝刈りを導入した音や映像の高速探索
- 区分線形写像に基づく音響信号の高速探索
- 3E-4 絵本の自動生成システムを用いた物語創造プロセスの可視化(人工知能一般(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- K-054 バイオリン指導における弓の速度と音の関係(教育工学・福祉工学・マルチメディア応用,一般論文)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 人物検出を目的とした照明変化に応じた背景画像の生成
- I-39 全方位カメラと複数のマイクロホンを用いた話者の検出(全方位画像解析・ロボットビジョン,I.画像認識・メディア理解)
- LI-4 擬人化エージェントのための小型円筒ディスプレイ(I. 画像認識・メディア理解)
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 解説 動的アクティブ探索法--室内中の物体を素早く探す技術
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 人と機械のインタラクションにおける画像技術 (メディア工学)
- ペット型ロボットのための全身触覚インタフェースによる人の触行動識別
- ペット型ロボットのための全身触覚インタフェースによる人の触行動識別
- 圧力分布センサによる人の触行動の実時間識別とその個人適応手法
- 変動輝度テンプレートによる頭部姿勢と表情の同時推定
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- Robust Character Recognition Using Adaptive Feature Extraction Method
- Basic Design of Video Communication System Enabling Users to Move Around in Shared Space
- H-036 Subtle Facial Expression Recognition Based on Expression Category-dependent Motion Magnification
- LH-003 変動輝度テンプレートを用いた頭部姿勢変動に頑健な確率的表情認識手法(画像認識・メディア理解)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- インデックス検索の情報理論的解析
- MODELING OBJECTS WITH A GENERAL PURPOSE POINT MASS SIMULATOR
- D-15-6 教育用物理モデルインタプリタの検討(D-15. 教育工学, 情報・システム1)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- 対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- 姿勢とアピアランスの変化に頑健な対象追跡を実現するアピアランス統合メモリベースパーティクルフィルタ(画像・映像解析,第13回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (マルチメディア情報ハイディング・エンリッチメント)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (画像工学)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (ライフインテリジェンスとオフィス情報システム)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- The Subjective Evaluation Experiments on an Automatic Video Editing System Using Vision-based Head Tracking for Multiparty Conversations (特集:日常活動を変革する情報システム技術)
- 身体尺から見直すタッチパネル・インタフェース : ハードウェアの模倣からソフトウェアの柔軟さ (メディア工学)
- ビデオ通信環境における対人印象に関する探索的研究 : 当事者評価と傍観者評価の比較(コミュニケーションの心理及び一般)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- ビデオ通信環境における対人印象の規定因に関する探索的実験研究 : 第三者に対する映像呈示と音声呈示の比較(コミュニケーション(技術),「身体,あそび,コミュニケーション」及びコミュニケーション一般)
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 非負制約下における複合行列分解
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 画像検索でのユーザ行動を利用した大規模画像アノテーション(一般物体認識,文字・文書,映像,医用画像,画像の認識・理解論文)
- sNMF:非負値制約下における複数行列の同時分解法 : ソーシャルメディア解析を応用例として(第15回情報論的学習理論ワークショップ)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション
- ACM Multimedia 2013参加報告と関連研究動向
- 関係データ解析のための長方形分割過程 (情報論的学習理論と機械学習)
- 大規模マルチメディア解析コーパスとしてのsocial curationの可能性(特別講演,大規模データベースとパターン認識)
- 非負制約下における複合行列分解とそのソーシャルメディア解析への応用
- 正確な色再現を目的とした2眼ステレオ式6バンドビデオシステム(テーマセッション,実時間処理実空間センシングと環境理解)
- 画像検索でのユーザ行動解析に基づく大規模画像アノテーション
- SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析(テーマセッション,大規模データベースとパターン認識)
- 人間の視覚的注意の計算モデル
- 人間の視覚的注意の計算モデル