ウェブ画像に対する領域ベースのセマンティックマイニングによるビジュアルコンセプトのモデリングに関する検討
スポンサーリンク
概要
- 論文の詳細を見る
In this paper we present a novel approach to modeling visual concepts effectively and automatically using web images. The selection of training data (positive and negative samples) is strongly related to the quality of learning algorithms and is an especially crucial step when using noisy web images. In this scheme, first, images are represented by regions from which training samples are selected. Second, region features effectively representing a semantic concept are determined, and on their basis, the representative regions corresponding to the concept are selected as reliable positive samples. Third, high quality negative samples are determined using the selected positive samples. Last, the visual model associated with a semantic concept is built through an unsupervised learning process. The presented scheme is completely automatic and performs well for generic images because of its robustness in learning from diverse web images. Experimental results demonstrate its effectiveness.
- 2010-03-01
著者
-
森本 正志
日本電信電話株式会社NTTサイバースペース研究所
-
森本 正志
NTTサイバースペース研究所
-
森本 正志
NTTレゾナント株式会社
-
森本 正志
日本電信電話株式会社nttサイバーソリューション研究所
-
森本 正志
Nttヒューマンインターフェース研究所
-
Taniguchi Yukinobu
NTT Cyber Solutions Laboratories, NTT Corporation
-
SUN Yongqing
NTT Cyber Solutions Laboratories, NTT CORPORATION
-
SHIMADA Satoshi
NTT Cyber Solutions Laboratories, NTT CORPORATION
-
MORIMOTO Masashi
NTT Cyber Space Laboratories, NTT CORPORATION
-
Taniguchi Yukinobu
Ntt Cyber Solutions Laboratories Ntt Corporation
-
Taniguchi Yukinobu
Ntt Cyber Solution Laboratories
-
Sun Yongqing
Ntt Cyber Solutions Laboratories Ntt Corporation
-
森本 正志
Ntt サイバースペース研
-
Morimoto Masashi
Ntt Cyber Space Laboratories Ntt Corporation
-
Shimada Satoshi
Ntt Cyber Solutions Laboratories Ntt Corporation
-
Shimada Satoshi
Ntt Cyber Solutions Laboratories
関連論文
- ソーシャルWebの今と未来(学生/教養のページ)
- A low-dimensional global feature extraction method using composition and color information for similar image retrieval (画像工学)
- ウェブ画像に対する領域ベースのセマンティックマイニングによるビジュアルコンセプトのモデリングに関する検討
- 映像解析技術に基づく編集機能をもつモバイル映像ブログシステム(コンテンツ技術,Web情報システム)
- 構図と色情報を用いた類似画像検索のための低次元グローバル特徴量抽出手法(画像映像処理・システム,ネットワーク,放送,一般)
- 映像シーン連動型掲示板コミュニケーションを用いたコミュニティ協働型メタデータ抽出方法(コンテンツ技術,Web情報システム)
- 分散偏在する映像からのコミュニティ形成方法の評価(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- 映像シーンとWeb文書との自動対応付けによるWeb情報ナビゲーションシステム(テーマセッション,データ工学とメディア理解との融合)
- ウェブ情報を用いた動的な意味ビジュアルモデルのマイニング(テーマセッション,データ工学とメディア理解との融合)
- 映像における複数モーダルイベントを利用した話題開始点検出(研究速報)
- カメラ注目点指示によるクエリ動画作成およびLHIに基づく映像シーン検索(一般セッション5(映像処理2),文字・文書の認識・理解)
- 映像ショット分類で生成したシンボル列に基づく任意映像区間の検索(映像・マルチメディア処理及び一般)
- 部分領域照合による画像類似度を用いた映像からの頻出ショットの検出(映像・マルチメディア処理及び一般)
- 部分領域照合による画像類似度を用いた映像からの頻出ショットの検出
- イベント検出画像の一覧に基づく映像ファイル検索インタフェースの有効性評価
- イベント検出画像の一覧に基づく映像ファイル検索インタフェースの有効性評価(コミュニケーション支援及び一般)
- 映像の構造情報を活用した視聴者間コミュニケーション方法の提案
- A-16-10 A new video editing interface based on the automatic extraction of emphasized speech and laughter scenes
- A new video editing interface based on the automatic extraction of emphasized speech and "laughter" scenes (画像工学)
- A new video editing interface based on the automatic extraction of emphasized speech and "laughter" scenes
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- D-12-117 Semantic Concept Modeling by Integrating Multiple Sub-concepts from Images
- 画像識別のための直線不変量ヒストグラムマッチング法(画像処理・解析, 画像の認識・理解論文)
- ソーシャル Web の今と未来
- 局地気象予測 : あなたの頭の上の天気をどうやって予測するか?
- D-12-27 分散並列型映像インデクシング方式の提案
- 分散偏在する映像からのコミュニティ形成方法の評価(オフィスインフォメーションシステム,ディジタルドキュメント、一般)
- 映像シーンとWeb文書との自動対応付けによるWeb情報ナビゲーションシステム(テーマセッション,データ工学とメディア理解との融合)
- ウェブ情報を用いた動的な意味ビジュアルモデルのマイニング(テーマセッション,データ工学とメディア理解との融合)
- メタデータサービスを支えるフレームワーク (特集 メタデータ応用サービスおよび関連技術の動向)
- D-9-13 分散偏在する映像を介したコミュニケーションシステム(D-9.オフィスインフォメーションシステム,一般講演)
- 映像を介したコミュニケーションにおけるシーンプロファイル自動生成技術とナビゲーションへの適用
- 映像を介したコミュニケーションにおけるシーンプロファイル自動生成技術とナビゲーションへの適用
- 映像を介したコミュニケーションにおけるシーンプロファイル自動生成技術とナビゲーションへの適用(画像処理)
- Web文書を用いたニュース映像の意味的なインデクシング(一般セッション4(映像処理1),文字・文書の認識・理解)
- 画像識別のための直線不変量ヒストグラムマッチング法(一般セッション(3))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- メタデータ展開のためのキャリングビークル (特集 メタデータ応用サービスおよび関連技術の動向)
- 高精度直線抽出のための可変ハフ変換 (画像処理技術)
- 構造化撮影テンプレートを用いた個人映像制作支援システム
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 部分領域照合による画像類似度を用いた映像からの頻出ショットの検出(映像・マルチメディア処理及び一般)
- イベント検出画像の一覧に基づく映像ファイル検索インタフェースの有効性評価(コミュニケーション支援及び一般)
- フィードバックを用いた映像とシナリオ文書の自動対応付け手法(復元と自動対応付け)(映像・マルチメディア処理とパターン認識・理解及び一般)
- フィードバックを用いた映像とシナリオ文書の自動対応付け手法(復元と自動対応付け)(映像・マルチメディア処理とパターン認識・理解及び一般)
- フィードバックを用いた映像とシナリオ文書の自動対応付け手法(復元と自動対応付け)(映像・マルチメディア処理とパターン認識・理解及び一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム (メディア工学)
- D-9-9 vlogテンプレートを用いたパーソナル映像制作システム(D-9.オフィスインフォメーションシステム,一般講演)
- 映像シーン分類のためのカメラ並進運動時の不変特徴量に基づく画像奥行分布の獲得
- 領域別動きベクトル分類に基づくパーソナル映像ショット分割
- 映像シーン分類のためのカメラ並進運動時の不変特徴量に基づく画像奥行分布の獲得(マルチメディアシステムの品質, 一般)
- 領域別動きベクトル分類に基づくパーソナル映像ショット分割(マルチメディアシステムの品質, 一般)
- 映像シーン分類のためのカメラ並進運動時の不変特徴量に基づく画像奥行分布の獲得(マルチメディアシステムの品質, 一般)
- 領域別動きベクトル分類に基づくパーソナル映像ショット分割(マルチメディアシステムの品質, 一般)
- 映像シーン分類のためのカメラ並進運動時の不変特徴量に基づく画像奥行分布の獲得(マルチメディアシステムの品質, 一般)
- 領域別動きベクトル分類に基づくパーソナル映像ショット分割(マルチメディアシステムの品質, 一般)
- 映像分類のためのカメラ回転運動・並進運動の逐次推定による画像の奥行分布獲得(文書・文字メディアの認識・理解, 一般)
- 映像分類のためのカメラ回転運動・並進運動の逐次推定による画像の奥行分布獲得(文書・文字メディアの認識・理解, 一般)
- 一般化可変Hough変換(2) : 一般曲線のための可変フィルタの設計
- 映像を介したコミュニケーションにおけるシーンプロファイル自動生成技術とナビゲーションへの適用(画像処理)
- 映像を介したコミュニケーションにおけるシーンプロファイル自動生成技術とナビゲーションへの適用(画像処理)
- ファンコミュニティサイトにおける映像シーン連動型掲示板コミュニケーションの分析
- ファンコミュニティサイトにおける映像シーン連動型掲示板コミュニケーションの分析(顔とコミュニケーション及び一般)
- 突発音検出と教師なし動きクラスタリングを用いた野球映像からの投球イベント検出(マルチメディア処理)
- 突発音検出と教師なしクラスタリングを用いた野球映像からの投球イベント検出(一般セッション(2))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- 電話を用いたハミング検索システム
- ハミング検索のための音楽データ自動時間正規化手法
- メタデータ付与を目的とした放送映像中からの人物顔検出(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・理解)
- 野球映像とスコアブックの統合による効率的なメタデータ付与(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・理解)
- 座標変換パラメータの並列推定に基づく複数距離情報の統合
- 可変フィルタによるハフ変換の高精度化
- 曲線こう配の誤差解析に基づく可変一般化ハフ変換
- 一般化可変Hough変換 : 編集処理への適用
- LoG可変フィルタによる高精度可変ハフ変換 : ハフ空間の周波数解析に基づく可変フィルタの設計
- LoGフィルタを用いた高精度可変Hough変換
- D-12-134 動物体アップショット検出の個人撮影映像への適用と評価(D-12.パターン認識・メディア理解,一般講演)
- B-15-1 カメラ付き携帯電話を活用したモバイル映像ブログシステム(B-15.モバイルマルチメディア通信,一般講演)
- D-12-22 動きを用いた動物体アップショット検出(D-12. パターン認識・メディア理解, 情報・システム2)
- 自在なマルチメディア操作を実現するメディアナビゲーション技術 (特集 次世代ポータル技術)
- 映像速覧のための音声のノンリニア時間圧縮再生方法に関する検討
- Hough変換の諸課題と新しいパターン計測-基礎編-
- 映像ショット分類で生成したシンボル列に基づく任意映像区間の検索(映像・マルチメディア処理及び一般)
- D-12-53 被写体形状の球面展開に基づく3次元物体認識の一検討(D-12.パターン認識・メディア理解,一般セッション)
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- 遺伝的アルゴリズムを用いた特徴と学習サンプルの同時選択とその文字認識への応用
- 商品属性の重視度を把握することによる嗜好推定及び商品推薦手法の開発
- 室内構造推定とSaliency Mapとを用いた看板検出技術(一般セッション,PRMUの拓く未来:Webスケール時代のパターン認識)
- Eye Contour Based Face Hallucination Method
- 高い識別率と低い次元数を共に実現させる遺伝的アルゴリズムを用いた特徴選択とその文字認識への応用
- 被写体形状・テクスチャの球面展開に基づく3次元物体認識 (マルチメディア・仮想環境基礎)
- 被写体形状・テクスチャの球面展開に基づく3次元物体認識 (パターン認識・メディア理解)
- Procrustes解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用 (パターン認識・メディア理解)
- D-12-2 群集の流動解析における特徴点マッチング手法の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- Procrustes解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用(一般セッション,実世界文字認識と理解)
- 被写体形状・テクスチャの球面展開に基づく3次元物体認識(実世界センシングとその応用)
- 被写体形状・テクスチャの球面展開に基づく3次元物体認識(実世界センシングとその応用)
- ディスプレイ Procrustes解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用
- Procrustes 解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用
- 被写体形状・テクスチャの球面展開に基づく3次元物体認識