Visual wordとwordの共起確率モデルを使った画像ラベリング(テーマセッション関連,一般物体認識・画像特徴量)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,インターネット上にあるWikipediaや画像検索エンジンから収集した文章と画像のセットを学習データとし,未知画像にラベリングを行う手法を提案する.インターネット上にある画像やテキストにはノイズが多い.そういったデータを学習対象として扱ったラベリングに関する既存研究は少ない.そこで,我々は,局所画像特徴量Visual wordとテキスト中の単語wordの共起確率をpLSAモデルを使って機械学習するラベリング手法を提案する.提案手法は,画像と単語の両方の特徴から潜在的なトピックを計算し機械学習するため,特徴のどちらかだけを学習に用いた既存手法よりも,ノイズの多い画像やテキストを学習データとしたときにロバストであると考える.我々は,シミュレーション実験によって,提案手法のモデルの正当性と有効性を確認した.さらに,Google Image Searchで収集した画像とhtmlデータを用いた予備実験の結果についても報告する.
- 2009-11-19
著者
関連論文
- Visual wordとwordの共起確率モデルを使った画像ラベリング(テーマセッション関連,一般物体認識・画像特徴量)
- 事前知識を用いたNon-negative Matrix Factorization(テーマセッション関連,一般物体認識・画像特徴量)
- ユーザーの領域分割結果に基づく一般物体認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ユーザーの領域分割結果に基づく一般物体認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 領域間で共通する特徴点の数を利用した代表画像への自動アノテーション手法(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- VisualRankの多クラスへの拡張 : 画像特徴量を用いた類似画像の自動分類とランキング付け手法(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- CVPR2011報告
- CVPR2011報告
- 計算環境の変遷に伴う特徴量研究の新しい展開 : モバイルコンピューティングからGPUまで(テーマセッション,実世界文字認識と理解)
- KINECTを用いた3次元復元の産業用ロボット教示への応用(実世界センシングとその応用)
- KINECTを用いた3次元復元の産業用ロボット教示への応用(実世界センシングとその応用)
- KINECTを用いた3次元復元の産業用ロボット教示への応用(実世界センシングとその応用)
- データ分布の2次モーメントのみにもとづくバイナリコーディング手法(第15回情報論的学習理論ワークショップ)
- KINECTを用いた3次元復元の産業用ロボット教示への応用