大規模画像データセットを用いたマルチクラス物体検出器の同時学習 物体毎に特化した負例クラスの導入
スポンサーリンク
概要
- 論文の詳細を見る
大規模データを用いて,マルチクラスの物体検出器を同時に最適化する効率的な手法を提案する.従来の物体検出器の学習は,各検出対象物体をpositiveサンプル,それ以外の物体をnegativeサンプルとして識別境界を決定する,"one-vs-aIl"のアプローチをとるものが主流であった.しかしながら,この方法では各クラスを独立に学習するため,異なるクラス間のスコアのバランスを調整できない.提案手法は,マルチクラスの識別手法を応用してマルチクラスの物体検出器を同時に学習することで,クラス間のバランスを最適化する.このとき,学習対象物体クラス間の差違だけでなく,その他の大量の背景画像と各クラスとの差違を考慮することで,未知物体の誤検出を抑える.実験では,大規模一般物体認識コンペテイションILSVRC2011で用いられた大量データセットのサブセットによる評価を行い,提案手法の有効性を示した.
- 2012-08-26
著者
-
原田 達也
東京大学大学院情報理工学系研究科
-
國吉 康夫
東京大学大学院情報理工学系研究科
-
金崎 朝子
東京大学大学院情報理工学系研究科
-
牛久 祥孝
東京大学大学院情報理工学系研究科
-
山下 裕也
愛媛大学大学院理工学研究科
-
原田 達也
東京大学大学院情報理工学系研究科知能機械情報学専攻
-
山下 裕也
東京大学大学院情報理工学系研究科
-
原田 達也
東京大学大学院情報理工学系研究科|JSTさきがけ
-
稲葉 翔
東京大学大学院情報理工学系研究科
-
村岡 宏是
東京大学大学院情報理工学系研究科
-
國吉 康夫
東京大学大学院工学系
関連論文
- AI Goggles:追加学習機能を備えたウェアラブル画像アノテーション・リトリーバルシステム(ヒューマンコンピュータインタラクション,情報爆発論文)
- 情報系複合領域アカデミック・ロードマップ
- 大規模Web画像のための画像アノテーション・リトリーバル手法(パターン認識応用,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 日常生活支援のための机上作業のモデル化およびその認識と支援軌道の生成
- ライフログによる物理・情報支援のためのアドホックワイヤレスネットワークの構築
- マージンに基づく問い合わせ学習を用いたオンライン動作認識
- 動作困難性と必要提示部位の人の動作模倣への関連性の検証と実験手法
- 時系列床面圧力分布情報を用いた個人識別システムの開発(一般セッション(2), ユビキタスメディアの将来展望)
- ディジタルヒューマンコンテンツ研究 : 人と機械の振舞いの計算機表現とその利用技術(日常生活にとけこむディジタルヒューマン)
- 1P2-N-059 アドホックワイヤレスネットワークに基づくライフログを利用した機器操作支援システム(人間機械協調2,生活を支援するロボメカ技術のメガインテグレーション)
- 1A1-N-093 酸素消費率に合わせてコントロールされる呼吸器・循環器統合シミュレータ(デジタルヒューマン1,生活を支援するロボメカ技術のメガインテグレーション)
- 室内三次元位置計測のためのSS無線と高精度時間計測LSIを用いた距離計測デバイスの開発
- オンライン時系列動作認識のための周辺化カーネル(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 人間動作データの定性表現に基づく物体操作作業の分類(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
- SVMを利用した日常動作認識におけるカーネルパラメータ最適化に基づく重要運動情報の発見(テーマセッション(5))(データマイニングとパターン認識・メディア理解)
- 2M-1 因果性発見を用いた時系列データからの情報の構造化・モデル化手法(進化的計算とデータマイニング,学生セッション,ソフトウェア科学・工学)
- 「ロボットを進化させる最先端IT技術」特集について
- 高次局所自己相関特徴を用いた車載カメラからの高速シーン認識
- 積分特徴と部分空間法を用いた高速三次元物体認識の実データへの適用(テーマセッション関連,一般物体認識・画像特徴量)
- 三次元環境地図からの物体探索タスク応用を目指したカラー立体高次局所自己相関特徴の開発
- 画像・単語間概念対応の確率構造学習を利用した超高速画像認識・検索方法(パターン認識・メディア理解のための学習理論とその周辺)
- 複数の重み付け領域特徴量の組み合わせによる高速物体認識(テーマセッション関連,一般物体認識・画像特徴量)
- Web画像と文章の大域的特徴から得る潜在的意味に基づくデータ検索 : Web上での一般画像認識実現への新たなアプローチを目指して(テーマセッション関連,一般物体認識・画像特徴量)
- 2K-3 ジャーナリストロボットシステム : 実世界からの自律的ニュース探索と事象の記述(情報爆発時代における実世界情報解析とロボット,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 2K-2 サイバーゴーグル : 画像情報からリアルタイムに実世界記述・検索を行うシステム(情報爆発時代における実世界情報解析とロボット,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 2K-1 画像・単語列間の確率的な概念獲得による高速かつ高精度な汎用的画像認識・検索手法(情報爆発時代における実世界情報解析とロボット,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 知的行動の発生原理(知能コンピューティングとその周辺〔第7回〕)
- 逆問題解析に基づく触覚分布センサ
- 対象同定に基づく道具身体化の計算論
- 模倣の適応性と創発性 : 実世界における人間的知性の基盤
- 情報爆発時代におけるヒューマンコミュニケーション基盤(情報爆発時代に向けた新しいIT基盤技術の研究)
- 等身大ヒューマノイドロボットによるダイナミック起き上がり行動の実現
- 2P1-N-043 マルチモーダル感覚の同期性に基づくロボット身体図式延長モデルと実機実現(認知ロボティクス2,生活を支援するロボメカ技術のメガインテグレーション)
- 1P1-N-052 力学系の有限時間到達可能性に基づく運動生成法(制御の新理論とモーションコントロール2,生活を支援するロボメカ技術のメガインテグレーション)
- ロボット模倣の創発・発達的構成論にむけて(模倣)
- 音声・画像入力からの概念獲得のためのインターモーダル学習(マルチメディアとパターン認識理解,一般)
- インターモーダル学習による概念の獲得(計算知能)
- ロボットハンドによる作業の統計的学習(情緒・感性・身体性)
- ヒューマノイドロボットのコツに基づく全身運動の模倣(ヒューマノイド1)
- ヒューマノイドのロバスト全身動作と制御システム(ヒューマノイド1)
- 機械はコツを身につけられるか (特集 ロボットから人間を読み解く)
- ロボットの知能 : 創発実体主義の挑戦
- 2P1-3F-F7 ゲルロボットの研究 : 空間分布電場平行移動法による電場応答性高分子ゲルの巻きつき運動生成
- 2P1-3F-F6 ゲルロボットの研究 : 空間分布電場平行移動法による電場応答性高分子ゲルの反転運動生成
- 2A1-3F-F5 ゲルロボットの研究 : 入力周波数変調法による電場応答性高分子ゲルの多極形状生成
- 2A1-3F-F4 ゲルロボットの研究 : 一様電場中における電場応答性高分子ゲルの波状パタン形成
- 1P1-3F-G5 C 言語記述のマルチタスクモニタを用いたメカトロ・プログラミング演習 : 東京大学機械情報工学科メカトロ演習・知能機械情報学演習
- 2P2-L06 ヒューマノイド腱太における随意・反射・状況反応行動の統合による適応性の実現
- 2P2-L05 三次元距離画像の RRT 探索によるヒューマノイドロボットの腕の動作計画
- 2P2-L04 脊椎構造を持つ人間型ロボットにおける GA による匍匐動作の自動獲得
- 1P1-F02 多種入出力を持つ全身腱駆動脊椎ヒューマノイド腱太のための拡張可能な通信システム構成
- 1P1-E05 姿勢角センサを用いた股関節部の変形補償量獲得による歩行動作の安定化
- 身体性に基づく認知とヒューマノイド(ヒューマノイドロボット)
- 神経振動子を用いた三次元2足足踏みシミュレーション - ヒューマノイドの実世界内行動を目指して -
- 圧力センサ枕による睡眠時呼吸・体動計測システムの実現
- 大規模画像データセットを用いた自動画像アノテーション (特集 大規模画像データ処理)
- 人間的身体性に基づく知能の発生原理解明への構成論的アプローチ
- AI Goggles : 追加学習機能を備えたウェアラブル画像アノテーション・リトリーバルシステム
- 1P1-78-126 センサ枕による人の睡眠中生理量計測
- 大規模画像データセットを用いた自動画像アノテーション(大規模画像データ処理)
- 大規模 Web 画像のための画像アノテーション・リトリーバル手法
- 1A1-J12 居住センサ空間から得られる長期行動情報に基づく人間の生活状況要約支援システム
- 1A1-J08 磁気センサによる人間の日常動作収集の高信頼化 : 居住空間内の家具センサに基づく手法の提案
- 5Y-7 移動体の自己位置情報を利用した画像からの異常領域検出(ロボットビジョン,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3N-6 因果指標のベイズ理論に基づく統一的な定式化(数理モデルとデータマイニング,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 時系列床面圧力分布情報を用いた個人識別システムの開発(一般セッション(2), ユビキタスメディアの将来展望)
- オンライン時系列動作認識のための周辺化カーネル(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 人間動作データの定性表現に基づく物体操作作業の分類(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
- 5ZC-5 場所依存の異常性検出に基づきインタビューを行う自律行動システム(社会システムとWeb(2),学生セッション,ネットワーク,情報処理学会創立50周年記念)
- ロボティック・サイエンスとは何か
- 「ロボティック・サイエンス」特集について
- 自律適応創発システム
- 「アカデミック・ロードマップ」特集について
- 特別講演 身体が脳をつくる--ロボットを題材とした構成論的科学のアプローチ (第13回認知神経科学会(平成20年7月12日・13日開催)(その2))
- ロボティックルームの知能 : ユービキタス知能
- 触れ合いロボットによる心理効果 -接触インタラクションによる安心感の演出と痛みの緩和-
- 生活環境中で人と共棲可能な永久磁石誘導型天井移動ロボットプラットフォーム
- 応答予測と馴化・脱馴化に基づき人とやりとりルールを探索・共創するロボットモデル
- サイバー世界と実世界と人間社会を融合する情報爆発時代のロボット知能 (小特集 情報爆発が創り出すサイバーフィジカルな情報処理)
- 9.サイバー世界と実世界と人間社会を融合する情報爆発時代のロボット知能(情報爆発が創り出すサイバーフィジカルな情報処理)
- 2A1-J21 アームとビジョンを持つ全方位移動ロボットの組込みシステムを用いた行動プログラミング演習 : 東京大学機械情報工学科における実践(ものづくり教育・メカトロニクスで遊ぶ)
- 2A1-D08 力学的三次元対称化法によるヒューマノイドロボットのオンライン受身動作生成(ヒューマノイド)
- 大規模一般画像認識と画像表現(テーマセッション,映像処理とTRECVID)
- 複数画像特徴とクラスラベルの相関に着目した距離計量による大規模画像分類(テーマセッション,映像処理とTRECVID)
- 2P2-B21 直感的な指示に基づく色・距離画像を用いた適切な物体抽出手法(ロボットビジョン)
- 2A1-L03 即応的把持 : 確率ネットワークを用いた知識モデルに基づく把持動作(進化・学習とロボティクス)
- 画像・長文からの潜在空間獲得による画像間類似度の改善
- 2P1-C08 カメラの動きに頑健な異常検出手法に基づく移動物体の検出(ロボットビジョン)
- 2A1-L02 ジャーナリストロボット : 実世界からニュース記事を自動生成するロボットシステム(進化・学習とロボティクス)
- 2P1-E20 移動ロボットによる有用な情報検出のための距離画像を用いた人の流れ推定
- 1P1-C21 複数人への聞き込みから記事を作成するロボットシステム
- 大規模画像データセットを用いたマルチクラス物体検出器の同時学習 物体毎に特化した負例クラスの導入
- 複数の画像特徴とPassive-Aggressiveを用いたfine-grained classification(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- 大規模画像データセットを用いたマルチクラス物体検出器の同時学習 : 物体毎に特化した負例クラスの導入(コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- 大規模画像データセットを用いたマルチクラス物体検出器の同時学習 : 物体毎に特化した負例クラスの導入(一般セッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
- 日本ロボット学会の次世代構想
- マルチモーダル情報の相互情報量に基づく異常検出に関する研究(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)
- ラベル間の階層構造を考慮したWeb画像アノテーション手法に関する研究(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)
- マルチモーダル情報の相互情報量に基づく異常検出に関する研究(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)
- ラベル間の階層構造を考慮したWeb画像アノテーション手法に関する研究(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)