サブトピックの組み合わせを考慮した画像辞書の学習による画像分類 : TRECVid 2012 Semantic Video Concept Detection参加報告(テーマセッション,大規模データベースとパターン認識)
スポンサーリンク
概要
- 論文の詳細を見る
一般画像をカテゴリで分類するための画像辞書の学習において、サブトピックの組み合わせを考慮する学習手法を提案する。画像の意味は画像における複数の要素(サブトピック)で構成されることがよくある。また、機械学習において、従来一般的である、一つのカテゴリに対しすべての学習データを用いて一つの画像辞書を生成する方法は、学習画像が大量の場合に膨大な処理時間を要するという問題がある。そこで本研究では、大規模クラスタリング手法Claraを適用してすべての学習画像を用いてサブトピックを生成し、あるカテゴリに関する画像辞書を構築するときに、各トピックに属する学習画像から、その意味ラベルが付与された学習画像を収集し、機械学習手法を用いてトピック毎の識別モデルを構築する。最後にトピック毎の識別モデルを合わせてその意味ラベルの画像辞書とする。TRECVid 2012のSemantic Video Indexing Taskにおいて提案手法を適用し、有効性を確認した。
- 2013-02-14
著者
-
孫 泳青
日本電信電話株式会社NTTサイバーソリューション研究所
-
谷口 行信
日本電信電話株式会社NTTサイバーソリューション研究所
-
数藤 恭子
Nttアイティ 画像事業部
-
谷口 行信
日本電信電話(株)nttサイバーソリューション研究所
-
数藤 恭子
日本電信電話株式会社 NTTメディアインテリジェンス研究所
-
谷口 行信
NTTメディアインテリジェンス研究所画像メディアプロジェクト
-
Guan Yue
Dalian University of Technology
-
Yi Lei
Dalian University of Technology
-
Li Haojie
Dalian University of Technology
関連論文
- MCMC法に基づく対象と環境に三次元モデルを用いた人物追跡(画像認識,コンピュータビジョン)
- 単眼動画像を用いた近接する複数対象の三次元追跡(一般,膨大なデータから学ぶもの)
- A-15-5 時空間画像を用いた映像アクセスインタフェース(A-15.ヒューマン情報処理,一般セッション)
- 分散偏在する映像からのコミュニティ形成方法の評価(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- 映像シーンとWeb文書との自動対応付けによるWeb情報ナビゲーションシステム(テーマセッション,データ工学とメディア理解との融合)
- ウェブ情報を用いた動的な意味ビジュアルモデルのマイニング(テーマセッション,データ工学とメディア理解との融合)
- 部分領域照合による画像類似度を用いた映像からの頻出ショットの検出(映像・マルチメディア処理及び一般)
- 部分領域照合による画像類似度を用いた映像からの頻出ショットの検出
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 空間分割による広範囲実時間人体の3次元形状復元(一般セッション2)
- 監視映像からの非定常度推定技術 (特集 映像モニタリングサービスを支える画像処理技術)
- LI_007 MCMC法に基づく3次元環境情報を用いた複数人物追跡(I分野:画像認識・メディア理解)
- 映像時空間内での変化領域を特徴量とする監視映像からの非定常度推定(テーマセッション(2),人の検出・計測・認識)
- 長時間の監視映像からの非定常シーケンスの検出(テーマ関連セッション)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 足圧中心の時間的な移動と空間的な移動軌跡に基づく歩行の良さの定量評価(画像認識,コンピュータビジョン)
- 高齢者の転倒予防のための歩行パラメータ抽出の検討
- D-16-17 医用画像検索のための撮像属性自動判別
- D-12-45 足圧中心軌跡を用いた歩行の美しさの点数化
- D-12-70 足圧の時空間特徴による歩行分析
- D-7-18 足底の時空間荷重分布に基づく人物動作分析
- I-83 医用画像情報統一管理のための撮像属性判別手法(画像レイアウト解析,I.画像認識・メディア理解)
- D-11-126 顔検出を用いた投稿動画の公開可否判断の効率化(D-11. 画像工学,一般セッション)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 6C-5 非定常行動検出における特徴量の検討(画像処理応用,一般セッション,人工知能と認知科学)
- D-12-118 複数の特徴抽出法の選択による非定常行動検出(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- 人物の位置と動き方向の学習に基づくリアルタイム非定常検出(一般,膨大なデータから学ぶもの)
- 単眼動画像を用いた近接する複数対象の三次元追跡(一般,膨大なデータから学ぶもの)
- 人物の位置と動き方向の学習に基づくリアルタイム非定常検出(一般,膨大なデータから学ぶもの)
- 遠隔映像モニタリングシステムを用いたオフィス状況監視
- 遠隔映像モニタリングシステムを用いたオフィス状況監視
- 映像時空間内での変化領域を特徴量とする監視映像からの非定常度推定(テーマセッション(2),人の検出・計測・認識)
- 転倒予防教室における高齢者の歩行解析の経時的変化
- 転倒予防教室における高齢者の歩行解析の経時的変化
- 入店客計数のためのシルエット・足音・足圧による男女識別法
- 転倒予防教室における高齢者の歩行解析
- 5M-9 映像構造化のためのテロップ属性抽出・分類法の提案
- A-16-30 SceneMarket : 映像素材流通のための協調アノテーション
- D-12-46 位置・姿勢情報と画像情報に基づく空撮映像のモザイク画像合成
- SceneCabinet:映像解析技術を統合した映像インデクシングシステム
- D-12-20 二段階ライン二値化による低解像度テロップ文字領域抽出
- 映像コンテンツの構造化・検索技術 (特集 情報流通プラットフォームが拓く21世紀のネットワーク化社会(2))
- D-11-91 動きベクトルと輝度差分による映像中の動き特徴抽出
- 分散偏在する映像からのコミュニティ形成方法の評価(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- 映像シーンとWeb文書との自動対応付けによるWeb情報ナビゲーションシステム(テーマセッション,データ工学とメディア理解との融合)
- ウェブ情報を用いた動的な意味ビジュアルモデルのマイニング(テーマセッション,データ工学とメディア理解との融合)
- 来訪者特徴の推定を利用した「場所メタデータ」自動生成(不均質なライフログからのデータマイニング及び一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 部分領域照合による画像類似度を用いた映像からの頻出ショットの検出(映像・マルチメディア処理及び一般)
- D-12-94 CGM動画を対象とした感情表出区間自動検出法(D-12.パターン認識・メディア理解,一般講演)
- Valbum : アルバム風絵コンテインタフェースを用いた映像編集視聴システム
- MPEG符号化映像からの高速テロップ領域検出法(動画像処理論文特集)
- MPEG符号化映像ショットチェンジ検出のための動き補償解析ハイブリッド法の提案(動画像処理論文特集)
- 2) MPEG符号化映像データからのシーンチェンジ検出方法の検討 (ネットワーク映像メディア研究会)
- MPEG符号化映像データからのシーンチェンジ検出方法の検討
- 5E-4 ライフスタイルと地理的特徴との関係を利用した場所メタデータ自動生成(ユビキタス,一般セッション,ネットワーク,情報処理学会創立50周年記念)
- 転倒予防教室における高齢者の歩行解析
- PanoramaExcerpts : パノラマ画像の自動生成・レイアウトによる映像一覧
- 来訪者特徴の推定を利用した「場所メタデータ」自動生成
- Procrustes距離を用いた3次元軌道の識別
- B-16-8 オフィスサイネージのユースケース検討(B-16. インターネットアーキテクチャ,一般セッション)
- ディジタルサイネージの放映計画最適化(情報・システム基礎)
- Procrustes距離を用いた3次元軌道の識別
- 商品属性の重視度を把握することによる嗜好推定及び商品推薦手法の開発
- 室内構造推定とSaliency Mapとを用いた看板検出技術(一般セッション,PRMUの拓く未来:Webスケール時代のパターン認識)
- 不均一分散を特徴とするProcrustes解析とその応用 (パターン認識・メディア理解)
- D-12-4 不均一分散重回帰モデルによるProcrustes解析(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- Procrustes解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用(一般セッション,実世界文字認識と理解)
- 幾何制約を用いた被写体形状・テクスチャの球面展開に基づく3次元物体認識
- 幾何制約を用いた被写体形状・テクスチャの球面展開に基づく3次元物体認識
- ディスプレイ Procrustes解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用
- 衣服の形状・色・柄による類似性判定と検索への応用 (パターン認識・メディア理解)
- 色,テクスチャ,及びタグ付けされた単語に基づいた画像の印象評価モデルの構築と分析
- 顧客行動の観測に基づく顧客の重視する商品属性の推定
- 商品写真から受ける印象と画像特徴の関係のモデル化
- 映像コンテンツ推薦システムのフィールド実験による主観評価(推薦システム,グループウェアとネットワーク,ライフログ活用技術,オフィス情報システム,セキュリティ心理学とトラスト,一般)
- 複数アルゴリズムの評価検討を踏まえた映像コンテンツ推薦システムの設計と実装(推薦システム,グループウェアとネットワーク,ライフログ活用技術,オフィス情報システム,セキュリティ心理学とトラスト,一般)
- 不均一分散を特徴とするProcrustes解析とその応用(一般セッション,医療における多次元大規模データ解析)
- 不均一分散を特徴とするProcrustes解析とその応用(一般セッション,医療における多次元大規模データ解析)
- 不均一分散を特徴とするProcrustes解析とその応用(一般セッション,医療における多次元大規模データ解析)
- 勾配方向の双対性とフラクタル次元を用いた細長い人工遮蔽物の検出
- 空間的連続性を考慮した物体領域とその境界線を同時表現するトピックモデル(画像・映像解析,画像の認識・理解論文)
- 衣服の形状・色・柄による類似性判定と検索への応用(テーマセッション,パターン認識によるインタフェースの未来)
- 素材から受ける質感評価のモデル化-両眼視差に基づいた画像特徴量の応用-
- 視線計測を用いた注視時間に基づく商品の購買決定要因の推定
- 符号化照明を使ったライト・トランスポートの獲得(画像・メディア処理技術,および一般)
- サブトピックの組み合わせを考慮した画像辞書の学習による画像分類 : TRECVid 2012 Semantic Video Concept Detection参加報告(テーマセッション,大規模データベースとパターン認識)
- SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析(テーマセッション,大規模データベースとパターン認識)
- 3次元点群からの局所形状と大域的な形状モデルを用いた柱状物体検出(テーマセッション,大規模データベースとパターン認識)
- D-12-62 ユーザフィードバックを利用した個人に適合する階層的画像分類(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス))
- オクルージョン境界検出のための3次元構成のトピック化(テーマセッション,大規模データベースとパターン認識)
- レシピのテキスト及び画像特徴の学習による画像からの素材・調理法の推定(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)