混合ガウスモデルを用いた自動画像アノテーション手法に対するノンパラメトリックベイズモデルの適用(コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
スポンサーリンク
概要
- 論文の詳細を見る
自動画像アノテーション(Automatic Image Armotation:AIA)とは,キャプション,キーワードという形で,デジタル画像に自動的にメタデータを付与する処理のことである.本レポートでは,混合ガウス分布モデル(Gaussian mixture model:GMM)を確率モデルとして用いたAIAアルゴリズムの改善に対する取り組みに関して報告する.GMMを確率モデルとして用いているAIAの代表的な従来手法であるSupervised Multiclass Labeling(SML)では,GMMの混合要素数は全てのラベルに対して一律に与えられているのみであった. GMMの性能は,いくつのガウス分布を重ね合わせるかを定める混合要素数に大きく依存することが知られている.そこ本研究では,混合要素数も事前に定めず,それぞれのラベルに対して与えられた学習データから最適な値を学習させることを試みた.具体的には,混合要素の生成過程として,ノンパラメトリックなベイズ推定モデルであるDirichlet Processを導入した.自動画像アノテーションの標準的なテストコレクションCorel 5K画像データベースによる評価を行った結果,提案手法は,従来モデルと比較して,安定した性能を示すことが分かった.
- 一般社団法人電子情報通信学会の論文
- 2012-08-26
著者
-
坪下 幸寛
富士ゼロックス(株)研究技術開発本部
-
岡田 真人
東京大学新領域創成科学研究科
-
坪下 幸寛
富士ゼロックス株式会社研究本部
-
岡田 真人
東京大学・新領域創成科学研究科 複雑理工学専攻
-
加藤 典司
富士ゼロックス(株)研究技術開発本部
-
岡田 真人
東京大学新領域
関連論文
- B23 トピックに依存した論文ランキング : 学術論文引用ネットワーク分析(セッションB2(情報システム構築),一般発表概要,第6回情報プロフェッショナルシンポジウム)
- 平滑化事前分布を用いた変動2値情報源の事後確率最大化法(研究速報)
- 誘導運動による運動検出感度の向上と低下を説明する神経回路モデル(ヒトの行動とモデル,神経ダイナミクス,一般)
- 脳と情報の統計力学(第53回物性若手夏の学校(2008年度),講義ノート)
- 神経集団符号に基づく自然画像統計量の弁別(視聴覚技術,ヒューマンインターフェース)
- 領域ベース結合MRFモデルによる大局的画像領域分割とCMOS回路実現
- 二次元投影図上の見えの操作に基づいた非透視投影の設計
- 並進対称なフィルタの下でのベイズ的に最適な画像再構成(一般(ベイズ法など),脳インタフェースの技術と応用,一般)
- どのモデルが発火率のダイナミクス,滑らかさを適切に記述するか?(ヒトの行動とモデル,神経ダイナミクス,一般)
- 減弱するシナプスを持つメキシカンハット型ネットワークの統計力学(ニューロハードウェア,ヒューマンインターフェース,一般)
- クラスタ化された特徴セットにより学習された複数識別器を用いた性別認識(テーマセッション, 顔・ジェスチャーの認識・理解)
- 作業分析のための顔及び手検出結果による動画像インデキシング(一般セッション(3))(ITS・監視・セキュリティのためのパターン認識・メディア理解)
- 自己組織化マップを用いた新規自動クラスタリング手法
- カーネル法を用いた形状認識モデルの提案とその回転顔画像検出への適応
- 新しい移動度モデルに基づく多結晶シリコンTFTの2次元解析
- XYI空間における面特徴を用いた顔認識(顔・身体動作認識, 画像の認識・理解論文)
- 画像分割を用いた高速顔検出 : 顕著度による探索領域抑制(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
- ランダムなスパイク列と規則的なスパイク列を判別するための最適な指標の探索(生体情報科学)
- 多様体学習を用いた近似contour treeプロット(セッション4:可視化)
- 2ニューロン系の多変量ARモデルに基づいた相互作用系解析
- 重複構造を有するコミュニティ抽出の統計力学的解析
- 非定常なスパイク列から隠れた構造を読み取る(脳のモデルと生物模倣情報処理2,生物模倣情報処理,機械学習,一般)
- 統計神経力学と母関数法によるCDMAマルチユーザー復調の理論(情報物理学の数学的構造)
- 集積回路実装に向けた大局的画像領域分割のための領域ベース結合MRFモデルのパラメータ制御(ニューロコンピューティングの実装とシステム化,ニューロコンピューティングの実装とシステム化,一般)
- 特許引用ネットワーク分析 : 技術をめぐる知の戦いの可視化
- 特許引用ネットワーク分析 : 企業競争力源泉としての知的財産権の強化に向けて(研究現場の生の声(その(2)),複雑ネットワーク科学の拡がり)
- ヒステリシスニューロンネットワークの統計力学的解析(機械学習,一般)
- 事後分布の局所変分近似における分布間の情報量について
- 漸次的持続活性の神経生理学的および計算論的知見が開く連想記憶の新しい地平
- 神経細胞の冗長性は運動学習の速度を最大化する (ニューロコンピューティング)
- 神経細胞の冗長性は運動学習の速度を最大化する (非線形問題)
- 最適視点計算を用いた絵画における多視点描画の再現
- 量子アニーリングに伴う残留エネルギー(2004年度後期基礎物理学研究所研究会「モンテカルロ法の新展開3」,研究会報告)
- 視覚特性を考慮した装飾的フォトモザイク
- 可解神経回路モデルと複雑なニューロンモデル(生体情報科学)
- 経頭蓋磁気刺激の神経メカニズム : 反回性皮質回路網でのスパイク抑制
- 変分ベイズ法による混合指数型分布を用いたクラスタリング法(一般(ベイズ法など),脳インタフェースの技術と応用,一般)
- 最適視点計算を用いた非透視投影図の自動生成
- 研究テーマ
- プラットフォームシミュレータの意義 : 可解神経回路モデルと複雑なニューロンモデル
- 25pTD-10 神経細胞の冗長性は学習速度を最大化する(25pTD ニューラルネットワーク,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 集積回路化を目指した大局的画像領域分割のための領域ベース結合MRFモデル
- 神経細胞の冗長性は運動学習の速度を最大化する(一般及び雑音を有効利用する神経系やそのモデル)
- シナプス可塑性を組み込んだ相関の理論
- 変形ランダムフォレストを用いた画像自動アノテーション(テーマセッション,映像処理とTRECVID)
- 神経細胞の冗長性は運動学習の速度を最大化する(一般及び雑音を有効利用する神経系やそのモデル)
- 小特集編集にあたって
- スパイク間隔による埋め込みにおけるノイズの影響について
- 確率的情報処理と統計力学 様々なアプローチとそのチュートリアル(4)確率的情報処理としての移動体通信(3)脳の数学理論とCDMA通信方式
- ブレグマン情報量を用いたベイズ学習の局所変分近似(知的システム,一般)
- 適応的ガウス混合モデルを用いた画像アノテーション (パターン認識・メディア理解)
- 適応的ガウス混合モデルを用いた画像アノテーション(一般セッション,実世界文字認識と理解)
- 隠れマルコフモデルを用いた行動・神経活動からの状態遷移抽出
- 混合ガウスモデルを用いた自動画像アノテーション手法に対するノンパラメトリックベイズモデルの適用 (情報論的学習理論と機械学習)
- 混合ガウスモデルを用いた自動画像アノテーション手法に対するノンパラメトリックベイズモデルの適用 (パターン認識・メディア理解)
- メキシカンハット型フィードフォワードネットワークにおける高次相関(一般,複雑系とニューロコンピューティング)
- リカレントネットワークによる複数モダリティから成る感覚情報の統合 : 視聴覚に対する刺激の発生源特定問題(一般,複雑系とニューロコンピューティング)
- 混合ガウスモデルを用いた自動画像アノテーション手法に対するノンパラメトリックベイズモデルの適用
- 27pAG-9 画像修復におけるパラメータ推定と誤差評価(27pAG 情報統計力学2,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 適応的ガウス混合モデルを用いた画像アノテーション
- リカレントネットワークによる複数モダリティから成る感覚情報の統合 : 視聴覚に対する刺激の発生源特定問題
- 短期的シナプス抑圧・促進を含む神経回路網の安定性解析
- 層内共通人力をもつフィードフォワードモデルにおける層間相関(BCI/BMIとその周辺,一般)
- Cell-HOG特徴量を用いた顕微鏡画像からの有核赤血球自動検出
- 混合ガウスモデルを用いた自動画像アノテーション手法に対する ノンパラメトリックベイズモデルの適用(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- 混合ガウスモデルを用いた自動画像アノテーション手法に対するノンパラメトリックベイズモデルの適用(コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- F-036 階層構造を持つ連想記憶モデルの構造発見へのデータ駆動型アプローチ(F分野:人工知能・ゲーム)
- 短期的シナプス抑圧・促進を含む神経回路網の安定性解析