Informative Patches Sampling for Image Classification by Utilizing Bottom-up and Top-down Information (パターン認識・メディア理解)
スポンサーリンク
概要
- 論文の詳細を見る
In image classification based on bag of visual words framework, image patches used for creating image representations affect the classification performance significantly. However, currently, image patches are sampled mainly based on processing low-level image information or just extracted regularly or randomly. These methods are not effective. In this report, we propose to explore both bottom-up information through processing low-level image information and top-down information through utilizing the statistical properties of training image grids to extract image patches. In the proposed work, an input image is divided into regular grids, each of which is evaluated based on its bottom-up information and/or top-down information. Subsequently, a saliency value is assigned to every grid based on the evaluation results, so that a saliency map can be created for the input image. Finally, the sampling of image patches is performed on the basis of the obtained saliency map. Furthermore, we propose a method to fuse the two kinds of information. The proposed methods are evaluated on both object categories and scene categories. Experiment results demonstrate their effectiveness.
- 一般社団法人電子情報通信学会の論文
- 2012-02-02
著者
-
竹内 義則
名古屋大学情報連携統括本部情報戦略室
-
MATSUMOTO Tetsuya
Graduate School of Information Science, Nagoya University
-
KUDO Hiroaki
Graduate School of Information Science, Nagoya University
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
大西 昇
名古屋大学工学部
-
Ohnishi Noboru
Graduate School Of Information Science Department Of Media Science Nagoya University
-
Matsumoto Tetsuya
Department Of Informatics Kyushu University
-
Takeuchi Yoshinori
Graduate School Of Information Science Department Of Media Science Nagoya University
-
Takeuchi Yoshinori
Graduate School Of Engineering Science Osaka University
-
Kudo H
Department Of Media Science Graduate School Of Information Science Nagoya University
-
大西 昇
名古屋大学 大学院情報科学研究科 メディア科学専攻
-
BAI Shuang
Graduate School of Information Science, Nagoya University
-
竹内 義則
Department Of Media Sience Graduate School Of Information Science Nagoya University
-
Bai Shuang
Department Of Media Sience Graduate School Of Information Science Nagoya University
-
Ohnishi N
The Department Of Media Science Graduate School Of Information Science Nagoya University
-
Takeuchi Yoshinori
The Department Of Media Science Graduate School Of Information Science Nagoya University
-
竹内 義則
大同大学
関連論文
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 視聴覚事象の中心的事例の教師なし学習
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- ディジタル画像内での部分複写の検出(改竄検出,映像符号化,システム及び一般)
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 超高速ステレオヘッドを用いた移動物体追跡と効率的協調制御(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- 選択的注意による視聴覚事象の対応付け--雑音下における視覚情報と聴覚情報の相互の利用
- Linear GP with Redundancy-removed Recombination for Synthesis of Image Feature Extraction Programs
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 分離パラメータ収束点推定を用いた源信号分離の収束性能の向上
- ラベル要素検出とモデル照合による商品棚ラベル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ラべル要素検出とモデル照合による商品棚ラべル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- D-12-145 超高速ステレオヘッドの冗長自由度の制御
- D-12-135 超高速ビジョンシステムと高速リニアスライダを用いた物体追跡
- 名古屋大学情報セキュリティ対策推進室の活動
- 最近のセキュリティインシデントと情報セキュリティ対策推進室の活動
- 生体模倣の実時間ビジュアルトラッキングシステム
- 生体模倣の実時間ビジュアルトラッキングシステム
- 視覚障害者向け商品情報取得システム
- タッチパネル操作における視覚障害者の指の誘導法
- 視覚障害者の共有資料観覧支援システム
- 生物に示唆を得た選択的注意による視聴覚事象の対応付け手法
- 事前学習を用いないオンラインでの話者識別(聴覚・音声・言語とその障害,一般)
- 物体操作による視聴覚事象の対応付け
- Linear GP with redundancy-removed recombination for synthesis of image feature extraction programs (数理モデル化と問題解決・バイオ情報学)
- リアルタイム字幕作成支援のための数式抽出
- 5ZD-6 聴覚障がい者向け情報保障のための講師発話からの指示語抽出手法の検討(障碍者補助・福祉,学生セッション,インターフェース)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 物体操作による視聴覚事象の対応付け(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 検索 : 組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション2)
- 検索-組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション,事例ベースメディア解析)
- 実環境音源分離におけるフィルタタップ数の低減手法
- 実環境音源分離におけるフィルタタップ数の低減手法
- A-10-6 マイクの近接配置による音源分離の性能評価と考察
- 運動で生じた視聴覚事象の対応付け(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 運動で生じた視聴覚事象の対応付け
- 運動で生じた視聴覚事象の対応付け
- F-13 指向性マイクを利用した移動音源分離(音声・音声言語情報処理,F.音声・音楽)
- オブジェクトと背景への画像の領域分割 (ヒューマンインフォメーション 立体映像技術)
- 視覚障害者の商品情報取得を支援する画像-音声変換システム (ヒューマンインフォメーション 立体映像技術)
- Teager Energy Operatorを使用した音声感情認識(一般, STRAIGHTスペシャルセッション(SS))
- 感情に関係する特徴量の検討(視聴覚情報処理及び一般)
- 振動子を用いた感情モデルとそのロボットへの応用
- 振動子を用いた情動モデルとそのロボットへの応用
- リアルタイム字幕作成支援のための数式抽出 (福祉情報工学)
- Acceleration of Genetic Programming by Hierarchical Structure Learning : A Case Study on Image Recognition Program Synthesis
- A-19-14 伝音難聴者のための会議聴取支援システムの提案(A-19.福祉情報工学,一般講演)
- 感情に関係する特徴量の検討
- K-17 視聴覚情報を用いた移動型ロボットの指示者探索システム(ヒューマンコミュニケーション基礎(2),K.ヒューマンコミュニケーション&インタラクション)
- ディジタル画像内での部分複写の検出
- 遠隔パソコン要約筆記のための指示語と指示動作との統合手法の検討(聴覚と福祉情報工学・一般)
- 遠隔パソコン要約筆記のための指示語と指示動作との統合手法の検討
- 情報セキュリティインシデントデータベースの運用と最近のインシデント発生状況
- 視覚障害者のための環境内文字情報獲得支援システムにおける文字列抽出率の向上と音声出力の順位付け(ヒューマンインフォメーション)
- 視覚障害者のための環境内の文字情報抽出システム
- 視覚障害者のための環境内の文字情報伝達システム抽出精度の向上と音声出力の順位付け(テーマセッション(2))(ユビキタスコンピューティングのためのパターン認識・理解)
- 囲碁盤面の評価方法(セッション(2) : ゲーム情報学(2))
- 単語の頻度統計を用いた文章の類似性の定量化 : 部分的類似性の考慮(自然言語処理)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- ロボットへの物体位置伝達を目的とした指差し動作と指示代名詞の併用
- 音源数の変化を伴う音源分離(研究速報)
- 音源数の変化を伴う音源分離(アレー信号処理・音響計測/一般)
- マイクの近接配置における周波数領域ブラインド音源分離の性能評価(音響信号処理/一般)
- マイクの近接配置における周波数領域ブラインド音源分離の性能評価(音響信号処理/一般)
- 全方位カメラとステレオカメラを併用した室内の可燃物情報分析の手法(一般セッション(2))
- 囲碁の中盤における評価関数
- D-8-2 コンピュータ囲碁における眼型計算法
- G-30 コンピュータ囲碁 : 人間の直感に近い勢力計算モデル(人工知能(一般),G.人工知能)
- 生成型学習とLSHを用いた視点変化に強いオブジェクト認識 (パターン認識・メディア理解)
- カメラの連携による複数移動物体の追跡
- カメラの連携による複数移動物体の追跡
- 聴覚障害者向け情報保障のための講師発話内指示語および指示動作抽出手法の検討
- 聴覚障害者向け情報保障のための講師発話内指示語および指示動作抽出手法の検討(高齢者の認知機能保障技術及び一般)
- 指先指示と指示代名詞を用いたロボットへの物体位置情報伝達
- 聴覚障害者のための警告音の識別(聴覚・音声・言語とその障害, 一般)
- A-4-47 実環境音源分離におけるタップ数の低減
- 頻度統計と概念辞書を用いた文章の類似性の定量化
- E-19 文章の類似性の定量化(情報抽出,E.自然言語・文書)