対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
スポンサーリンク
概要
- 論文の詳細を見る
人間は、特に意識をしなくとも、見た映像を理解し言語化できる。しかし、これらのタスクを計算機に代行させる映像認識/理解は、パターン認識分野における早期からの最重要課題の1つでありながら、未だ本質的な解決に至っていない。ただ、人間もこれらの能力を先天的に兼ね備えているとは考えにくく、その大部分が成長の過程で後天的に身に付けていくと考えられる。本報告では、認知発達的アプローチに基づく映像認識理解の枠組について議論した昨年の報告、及び近年の関連研究の動向などを踏まえた上で、映像認識理解のための能力や知識を獲得する戦略のあり方について言及する。特に、戦略構築の過程において必然的に人間がその系の中に取り込まれる強化学習としての側面、及びその際に人間のみならず計算機自身に適応する形で戦略の基本構造が動的に変化する点について、より具体的に踏み込んだ議論を行う。
- 2010-12-02
著者
-
坂野 鋭
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
坂野 鋭
NTTコミュニケーション科学基礎研究所
-
木村 昭悟
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
坂野 鋭
(株)nttデータ技術開発本部
-
坂野 鋭
(株)nttデータ
-
坂野 鋭
株式会社nttデータ
-
前田 英作
NTTコミュニケーション科学基礎研究所知能情報研究部
-
南 泰浩
日本電信電話株式会社:nttコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
-
木村 昭悟
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
木村 昭悟
東京工業大学工学部電気電子工学科
-
南 泰浩
NTTコミュニケーション科学基礎研究所
-
前田 英作
NTTヒューマンインタフェース研究所
-
南 泰浩
日本電信電話(株)コミュニケーション科学基礎研究所
-
南 泰浩
日本電信電話株式会社コミュニケーション科学基礎研究所
-
前田 英作
日本電信電話(株)コミュニケーション科学基礎研究所
-
坂野 鋭
日本電信電話(株)コミュニケーション科学基礎研究所
-
坂野 鋭
Nttデータ通信株式会社
-
木村 昭悟
日本電信電話(株)コミュニケーション科学基礎研究所
-
坂野 鋭
株式会社nttデータ情報科学研究所
-
坂野 鋭
(株)nttデータ マルチメディア技術センタ
-
前田 英作
Ntt
-
杉山 弘晃
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
坂野 鋭
NTTデータ通信株式会社 情報科学研究所
関連論文
- 文書集合と著者集合の依存関係を説明する潜在変数モデル(データ工学,Web情報システム)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- ユーザの嗜好の時系列性と先行性に着目した協調フィルタリング(コンテンツ技術,Web情報システム)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- カーネル判別分析を用いた正準角の統合による相互部分空間法の改良(パターン認識基礎,画像の認識・理解論文)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- 誤り訂正学習による動作認識と個人適応への試み
- 方向性特徴は何故有効なのか? : 抽象図形によるアプローチ(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- 唇動作と音声を用いたカーネル判別分析による個人認証方式(メディア処理,画像の認識・理解論文)
- クラスタリングを用いた核非線形相互部分空間法の処理量削減手法(パターン認識と理解,画像の認識・理解論文)
- 核非線形相互部分空間法による話者認識(パターン認識基礎, 画像の認識・理解論文)
- バイオメトリクスの精度評価
- D-14-14 母音音素分布の非線形性について(D-14. 音声・聴覚)
- バイオメトリクス認証はインターネット社会の役に立つか?
- 非線形構造に着目した識別ルール抽出法(バイオインフォマティクスとパターン認識)
- D-12-55 顔画像検出におけるデータ採取地の影響について
- D-12-45 非線形構造に着目した識別ルール抽出法
- D-12-44 区分線型構造に着目した識別ルール抽出法
- 顔画像認識におけるデータ採取地の影響について
- クラスタリングによる遺伝子解析 : 遺伝子型の自動分類
- クラスタ構造に着目した特徴空間の可視化 : クラスタ判別法(情報論的学習理論論文小特集)
- D-12-2 クラスタ判別法による顔画像データ解析
- 分布の構造に着目した特徴空間の可視化 : クラスタ判別法
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- Linear and nonlinear hybrid kernel mutual subspace method for object recognition (パターン認識・メディア理解)
- 縁取りに着目したテロップ認識(文書・文字メディアの認識・理解, 一般)
- 縁取りに着目したテロップ認識
- Steerable filterによるテクスチャ特徴抽出(複合現実感とパターン認識・メディア理解, 一般)
- 学習機械は働いているか?(統計モデルと学習の数理)
- 多重バイオメトリクス
- パターン認識における統計的手法(第17回日本計算機統計学会大会報告)(特別講演II)
- 多重カテゴリに基づく画像検索法の提案(テーマセッション(5))(データマイニングとパターン認識・メディア理解)
- 認識理解への認知発達的アプローチ (パターン認識・メディア理解)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- CLAFIC, Well Balanced Perceptoron再訪--我々はぐるぐる回っているのか? (パターン認識・メディア理解)
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 核非線形相互部分空間法の振る舞いについて(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 核非線形相互部分空間法の振る舞いについて(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- カーネル判別分析を用いた正準角の統合による相互部分空間法の改良
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- グローバルな枝刈りを導入した音や映像の高速探索
- 区分線形写像に基づく音響信号の高速探索
- 縁取りに着目したテロップ認識(文書・文字メディアの認識・理解, 一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 多クラス早期認識ブースティング法(一般,顔・人物・ジェスチャ・行動)
- 多クラス早期認識ブースティング法(一般,顔・人物・ジェスチャ・行動)
- 誤り訂正学習による動作認識の試み
- パターン認識研究におけるWhy : 特徴空間観測装置の開発に向けて(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- データマイニングの鉱脈を探る : パターン認識の視点から(データセッション(4))(データマイニングとパターン認識・メディア理解)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- インデックス検索の情報理論的解析
- メディア応用システム(メディア情報,映像情報メディア年報)
- 方向性特徴は何故有効なのか?
- 生体認証技術の最近の動向
- 特別講演 バイオメトリック個人認証の現状 (〔日本鑑識科学技術学会〕第10回学術集会講演要旨集)
- バイオメトリクス・個人認証のためのパターン認識 (特集 パターン認識の最近の動向)
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- 対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- CLAFIC, Well Balanced Perceptoron再訪 : 我々はぐるぐる回っているのか?(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- EVENT REPORTS 「NTTコミュニケーション科学基礎研究所オープンハウス2011」開催報告
- 部分空間法の最近の発展
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- 大局的構造情報を用いたオンライン数字認識(テーマセッション,実世界文字認識と理解)
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 非負制約下における複合行列分解
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 大局的構造情報を用いたオンライン数字認識
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 大局的特徴に対するDPマッチング
- 画像検索でのユーザ行動を利用した大規模画像アノテーション(一般物体認識,文字・文書,映像,医用画像,画像の認識・理解論文)
- sNMF:非負値制約下における複数行列の同時分解法 : ソーシャルメディア解析を応用例として(第15回情報論的学習理論ワークショップ)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション
- ACM Multimedia 2013参加報告と関連研究動向
- 関係データ解析のための長方形分割過程 (情報論的学習理論と機械学習)
- 大規模マルチメディア解析コーパスとしてのsocial curationの可能性(特別講演,大規模データベースとパターン認識)
- 非負制約下における複合行列分解とそのソーシャルメディア解析への応用
- 画像検索でのユーザ行動解析に基づく大規模画像アノテーション
- 正規分布に基づくFisher判別分析の補正項(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析(テーマセッション,大規模データベースとパターン認識)
- 人間の視覚的注意の計算モデル
- 人間の視覚的注意の計算モデル