学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解)
スポンサーリンク
概要
- 論文の詳細を見る
本稿は,映像中の一般音源同定を目的としている.一般音源同定とは,音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す.本稿では,一般音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.音源となり得る物体が複数カテゴリ存在するため,学習には,音特徴に加え,一般物体認識に有効とされる複数の画像特徴を用いる.まず,その画像特徴と音特徴を独立に扱いながら,識別器学習を試みる.その場合,音源同定問題独特の性質として,画像特徴と音特徴が与えられても音特徴がほとんど識別に寄与しないことが確認される.次にその解決法として,画像-音の相関特徴を識別器の学習に追加する.これにより,原理的に,音特徴が初めて有効に活用される.この事実を認識実験を行い,吟味した.
- 2011-03-03
著者
-
馮 尭楷
九州大学大学院システム情報科学研究院
-
内田 誠一
九州大学 大学院システム情報科学研究院
-
Feng Yaokai
九大 大学院システム情報科学研究院
-
フォン ヤオカイ
九州大学大学院システム情報研究院
-
池田 千廣
九州大学大学院システム情報科学府
-
内田 誠一
九州大学大学院システム情報科学府
-
内田 誠一
九州大学大学院 システム情報科学研究院
関連論文
- 付加情報の一般的な割当(パターン認識)
- 相互制約付き多数決型アルゴリズムによる時系列パターン認識(研究速報)
- 非線形有限要素解析を模したニューラルネットワークを用いた軟性臓器ボリュームモデルの変形シミュレータ(コンピュータグラフィックス)
- 4.パターン認識・メディア理解の問題分析(パターン認識・メディア理解のグランドチャレンジ)
- 5.パターン認識・メディア理解の10大チャレンジテーマ(パターン認識・メディア理解のグランドチャレンジ)
- データベースおよびクエリの拡張による文書画像検索の精度向上法 (ヒューマン情報処理)
- AdaBoostによる気道・食道自動識別(画像認識,コンピュータビジョン)
- Boostingによるカメラ選択を用いた行動認識(一般セッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 逆投影と幾何拘束を用いた2D/3D位置合せ(画像認識,コンピュータビジョン)
- 解析的DPマッチングを用いた手書き数字認識 (パターン認識・メディア理解)
- 大局的最適化に基づくトラッキング : DPトラッキング(追跡・位置合わせ,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- ディジタルペン
- ペン先画像からの手書き復元(研究速報)
- 自己発信情報の組み込みによる移動体の分離追跡
- 検出容易な文字パターン生成に関する検討(テーマセッション1,複合現実感のためのパターン認識・理解)
- ペン先カメラ画像からの手書きパターンの抽出(テーマセッション1,複合現実感のためのパターン認識・理解)
- レイアウトに依らない平面文書画像の射影歪み補正(テーマセッション5,複合現実感のためのパターン認識・理解)
- データ埋め込みペンに関する基礎的検討
- 相互制約付き多数決型アルゴリズムによる時系列パターン認識
- 初期活字印刷本中の文字の形状解析(テーマセッション1,複合現実感のためのパターン認識・理解)
- 中世英文学資料の認識および解析 : 意義・問題点および予備検討結果(テーマセッション6,文字・文書の認識・理解)
- 環境コンテキスト利用による情景画像中文字検出 (パターン認識・メディア理解)
- An interface for embedding online information during writing (パターン認識・メディア理解)
- ペン先カメラ画像と紙面上特徴点を用いた手書きパターンの復元 (パターン認識・メディア理解)
- 文字・文書の認識・理解に関するグランドチャレンジ私案(テーマセッション2,複合現実感のためのパターン認識・理解)
- モード切り替えを伴うパーティクルフィルタ(一般セッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 解析的DPマッチングを用いた手書き数字認識(テーマセッション,文字・文書の認識・理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- データ埋め込みペンの実装(テーマセッション,文字・文書の認識・理解)
- ペン先カメラ画像と紙面上特徴点を用いた手書きパターンの復元(テーマセッション,文字・文書の認識・理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- Part-based文字認識の試み : 手書き数字認識に大局的構造は必要か?(テーマセッション,文字・文書の認識・理解)
- 環境コンテキスト利用による情景画像中文字検出(テーマセッション,文字・文書の認識・理解)
- 特徴追跡と文書画像検索を用いたカメラペンシステム(テーマセッション(デモ発表特集),文字・文書の認識・理解)
- 局所特徴量を用いた事例参照に基づく位置同定(一般セッション,文字・文書の認識・理解)
- 局所特徴を利用したナンバープレート検出(テーマセッション,文字・文書の認識・理解)
- パターン認識・メディア理解のグランドチャレンジ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 多数決型アルゴリズムによる非線形伸縮時系列パターン認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 多数決型アルゴリズムによる非線形伸縮時系列パターン認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 離散型DPと解析的DPの統合による動画像中の物体追跡(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 大局的観測と局所的観測の統合による複数人物の無矛盾な位置同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 離散型DPと解析的DPの統合による動画像中の物体追跡(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- I-075 プロアクティブヒューマンインタフェースのためのジェスチャの早期認識に関する検討(I.画像認識・メディア理解)
- 学習による映像中の音源同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 学習による映像中の音源同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 文書画像の事例ベース傾き補正の改良(テーマセッション1,文字・文書の認識・理解)
- 大局的観測と局所的観測の統合による複数人物の無矛盾な位置同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- H-031 多峰型解析的DPを用いた動画像中の物体追跡(H分野:画像認識・メディア理解,一般論文)
- 座標特徴と方向特徴の選択的利用に基づくオンライン文字認識HMM(画像認識,コンピュータビジョン)
- 筆順変動を表現するHMMとそのオンライン文字認識への応用(画像認識,コンピュータビジョン)
- オンライン文字認識HMMにおける座標特徴と方向特徴の利用方法の検討(テーマセッション4,文字・文書の認識・理解)
- 招待講演 情報埋め込みペンによる手書き価値の向上 (マルチメディア情報ハイディング・エンリッチメント)
- 弾性マッチングと固有変形を用いたオンライン文字認識(画像情報)(次世代移動体通信システム)
- 2次元ワープを用いた顔画像処理
- 解析的DPマッチングを用いた手書き数字認識
- RFIDを援用した映像中の人物追跡
- 環境コンテキストによる情景内文字検出の高精度化(テーマセッション,文字・文書の認識と理解)
- 蛍光を用いた匂い可視化センシング
- サンプル文字画像からの文字パターンの合成(テーマセッション,文字・文書の認識と理解)
- 学習による細胞内粒状物質の検出(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- 学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解)
- 複数人物の無矛盾な位置同定における時系列処理の導入(一般セッション,文字・文書の認識と理解)
- 非マルコフ的弾性マッチング(一般セッション,文字・文書の認識と理解)
- 局所特徴を用いた文字検出の試み(テーマセッション,文字・文書の認識と理解)
- DP-1-3 パターン認識・メディア理解の挑戦すべき課題 : パターン認識基礎と文書認識の視点で(DP-1. パターン認識・メディア理解の挑戦すべき課題-2010年代に向けて-,パネルセッション,ソサイエティ企画)
- 早期認識のためのBoosting的学習法の提案とそのオンライン文字認識への応用(テーマセッション4,文字・文書の認識・理解)
- 回転を許容した非同期DPマッチングによるオンライン文字認識(テーマセッション,文字・文書の認識と理解)
- 手書き数字認識におけるデータベースの大規模化の効果(テーマセッション+一般セッション,PRMUのフロンティア・グランドチャレンジ)
- ゴールキーパーがペナルティキックを止めるには : DPマッチングを用いたキッカーの動作解析(コミュニケーション支援,一般)
- ゴールキーパーがペナルティキックを止めるには : DPマッチングを用いたキッカーの動作解析(コミュニケーション支援,一般)
- 情報埋め込みペンによる手書き価値の向上(キックオフ・イベント)
- 局所特徴に基づくスキュー補正(テーマセッション,実世界文字認識と理解)
- 匂いイメージングセンサ用匂い検知フィルムの開発
- 手書き文字を対象とした解析的2次元DPマッチングの動作解析(テーマセッション,実世界文字認識と理解)
- part-basedオンライン文字認識の試み(テーマセッション,実世界文字認識と理解)
- 多重仮説に基づいた情景画像中文字認識の検討(テーマセッション,実世界文字認識と理解)
- 大局的最適化による細胞内粒子の追跡(テーマセッション,時系列パターン認識)
- 匂いイメージングセンサ用匂い検知フィルムの開発
- 大局的最適化による細胞内粒子の追跡(テーマセッション,時系列パターン認識)
- 局所特徴を用いた細胞画像認識(一般セッション,時系列パターン認識)
- 事例に基づく筆順推定(テーマセッション,時系列パターン認識)
- 大規模手書き文字認識 : ネットワーク解析に見る文字パターン分布(テーマセッション,実世界文字認識と理解)
- ライブセルイメージのための雑音除去(一般セッション,時系列パターン認識)
- ライブセルイメージのための雑音除去(一般セッション,時系列パターン認識)
- カメラペンシステムにおける筆跡復元精度の向上(テーマセッション,実世界文字認識と理解)
- 局所特徴を用いた細胞画像認識(一般セッション,時系列パターン認識)
- 事例に基づく筆順推定(テーマセッション,時系列パターン認識)
- 大規模手書き文字認識 : 欠損部補完に見る文字パターン分布(テーマセッション,実世界文字認識と理解)
- 大局的構造情報を用いたオンライン数字認識(テーマセッション,実世界文字認識と理解)
- Reading-Lifelogの実現に向けた予備的検討(テーマセッション,実世界文字認識と理解)
- 段階的な枝刈りによるアフィン不変な文字認識
- 文字の選択的隠蔽 (マルチメディア情報ハイディング・エンリッチメント)
- 文字の選択的隠蔽 (応用音響)
- 特徴選択を伴う早期認識 (パターン認識・メディア理解)
- 文字の選択的隠蔽(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 特徴選択を伴う早期認識(持続可能な社会に貢献するパターン認識)
- カメラ・プロジェクタシステムを用いたタッチスクリーンの構築(持続可能な社会に貢献するパターン認識)
- カメラ・プロジェクタシステムを用いたタッチスクリーンの構築(持続可能な社会に貢献するパターン認識)
- 文字の選択的隠蔽(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 特徴選択を伴う早期認識(持続可能な社会に貢献するパターン認識)