映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
スポンサーリンク
概要
- 論文の詳細を見る
人間は、特に意識をしなくとも、見た映像を理解し言語化でき、与えられた映像群の中から自身の思い描く映像を的確に見つけ出すことができる。しかし、これらのタスクを計算機に代行させる映像認識理解問題や映像検索問題は、パターン認識分野における早期からの最重要課題の1つでありながら、未だ本質的な解決に至っていない。ただ、人間も映像認識・理解・検索の能力を先天的に兼ね備えているとは考えにくく、その大部分が成長の過程で後天的に身に付けていく性質のものであると考えられる。本報告では、この点に着目し、認知発達的アプローチに基づく新しい映像認識理解、特にそのための知識獲得戦略のあり方を提案する。本報告で提案する枠組において、従来のアプローチと異なる特に重要な点は、以下の2点である。(1)映像の認識・理解に必要な知識の能動的かつ自律的な獲得、(2)自らの発達段階に応じた知識獲得戦略の動的遷移。本報告では、このアプローチの初期的な試みとして、発達初期段階における乳幼児の典型的な行動を参考にして作成した知識獲得システムのプロトタイプについて紹介すると共に、提案する枠組の具体的な方向性とその実現可能性について議論する。
- 2009-12-10
著者
-
木村 昭悟
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
高木 茂
国立沖縄工業高等専門学校情報通信システム工学科
-
福地 賢
沖縄工業高等専門学校情報通信システム工学科
-
高木 茂
沖縄工業高等専門学校情報通信システム工学科
-
柏野 邦夫
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
福地 賢
国立沖縄工業高等専門学校電子通信システム工学コース
-
柏野 邦夫
NTTコミュニケーション科学基礎研究所
-
木村 昭悟
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
木村 昭悟
東京工業大学工学部電気電子工学科
-
高木 茂
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)基礎研究所 情報科学研究部
-
赤嶺 一馬
国立沖縄工業高等専門学校情報通信システム工学科
-
柏野 邦夫
Ntt コミュニケーション科学基礎研
-
赤嶺 一馬
沖縄工業高等専門学校情報通信システム工学科:(現)宮崎大学工学部
-
柏野 邦夫
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 音響指紋技術とその応用
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 適応型混合テンプレートを用いた音源同定 : 音楽演奏への適用
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- 音声分離と楽音分離の統合のための音オントロジーの提案
- メディアコンテンツ特定技術の最新動向
- 認識理解への認知発達的アプローチ (パターン認識・メディア理解)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 実環境で収録された映像断片をキーとする一致映像探索(マルチメディア応用,画像の認識・理解論文)
- 高速メディア探索 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 音楽や映像の高速探索(工学と芸術を融合する若い息吹)
- ベイジアンネットワークの音響認識への応用
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 背景差分法による物体検出を目的とした逐次モンテカルロ法による背景推定(画像・映像処理)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- グローバルな枝刈りを導入した音や映像の高速探索
- 同じ音や映像を高速に探す技術--学習アクティブ探索法 (特集論文1 高度検索技術)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 区分線形写像に基づく映像信号の高速探索
- 解説 確率ディザボーティング--低品質な映像も瞬時に探すためのコア技術
- R&Dホットコーナー 楽曲やCMの高速検索を実現する学習アクティブ探索ライブラリ--NTTコミュニケーション科学基礎研究所
- 音や影像を素早く探すメディア探索技術の未来 (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 人物検出を目的とした照明変化に応じた背景画像の生成
- I-39 全方位カメラと複数のマイクロホンを用いた話者の検出(全方位画像解析・ロボットビジョン,I.画像認識・メディア理解)
- LI-4 擬人化エージェントのための小型円筒ディスプレイ(I. 画像認識・メディア理解)
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 解説 動的アクティブ探索法--室内中の物体を素早く探す技術
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- TRECVID 2010 Instance Searchタスク参加報告 (パターン認識・メディア理解)
- 多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法(音楽情報処理)
- 2値多重音響特徴ベクトルを用いた類似音楽探索とその高速化(マルチメディアパターン処理)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- インデックス検索の情報理論的解析
- MODELING OBJECTS WITH A GENERAL PURPOSE POINT MASS SIMULATOR
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 時系列アクティブ探索法に基づく音や映像の高速AND/OR探索
- ヒストグラム特徴系列に基づく長時間音響信号の高速探索
- 音の流れを認識して楽器を聞き分けるコンピュータ (特集論文 ヒューマノイド・テクノロジー&サイエンス研究)
- 音や映像を瞬時に探す時系列アクティブ探索法
- D-15-6 教育用物理モデルインタプリタの検討(D-15. 教育工学, 情報・システム1)
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- 対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 非負制約下における複合行列分解
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 画像検索でのユーザ行動を利用した大規模画像アノテーション(一般物体認識,文字・文書,映像,医用画像,画像の認識・理解論文)
- sNMF:非負値制約下における複数行列の同時分解法 : ソーシャルメディア解析を応用例として(第15回情報論的学習理論ワークショップ)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション
- ACM Multimedia 2013参加報告と関連研究動向
- 関係データ解析のための長方形分割過程 (情報論的学習理論と機械学習)
- 大規模マルチメディア解析コーパスとしてのsocial curationの可能性(特別講演,大規模データベースとパターン認識)
- 非負制約下における複合行列分解とそのソーシャルメディア解析への応用
- 画像検索でのユーザ行動解析に基づく大規模画像アノテーション
- SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析(テーマセッション,大規模データベースとパターン認識)
- 人間の視覚的注意の計算モデル
- 人間の視覚的注意の計算モデル