色ヒストグラム特徴とパン・チルト・ズームカメラを用いた高速物体探索法 : 動的アクティブ探索法 (<特集>画像の認識・理解論文特集)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,3次元実環境中にある物体をパン・チルト・ズームカメラを用いて高速に探索する手法を提案する.これは画像から特定の物体を高速に探索する技術「アクティブ探索法」を拡張したものである.実環境中の物体は,照明条件や物体の向きやカメラパラメータの違いにより大きさや見え方が異なる.これに対処するには,様々な見え方に対応して参照画像を増やすことが有効であるが,単純に増やすだけでは探索時間が増大する.それに加えて,物体が遠方にある場合には段階的にパン・チルト・ズームを行う必要があり,これによりカメラ制御回数も膨大になる.提案手法では,まず増加した参照画像間のヒストグラムの類似性を用いて探索する時間を削減する.更に,本手法をカメラ制御の予測に動的に利用し,カメラ制御回数も削減する.実験の結果,室内環境においてカメラから5m以内の位置にある小物体を正しく探索するのに,従来のアクティブ探索法と単純なカメラ制御を用いた従来法に比較し,探索速度は4倍以上向上し,本手法の有効性を確認した.
- 社団法人電子情報通信学会の論文
- 2001-08-01
著者
-
川西 隆仁
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
-
川西 隆仁
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所:(現)(株)ぷららネットワークス
-
川西 隆仁
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
村瀬 洋
日本電信電話株式会社nttコミュニケーション科学基礎研究所:(現)名古屋大学大学院情報科学研究科
-
村瀬 洋
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
関連論文
- 色を忠実に再現する高精細分光画像撮影技術 (特集 「見る・見せる」技術の最先端)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法(画像処理, 画像パターン認識)
- 背景差分法による物体検出を目的とした逐次モンテカルロ法による背景推定(画像・映像処理)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- 同じ音や映像を高速に探す技術--学習アクティブ探索法 (特集論文1 高度検索技術)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 人物検出を目的とした照明変化に応じた背景画像の生成
- I-39 全方位カメラと複数のマイクロホンを用いた話者の検出(全方位画像解析・ロボットビジョン,I.画像認識・メディア理解)
- LI-4 擬人化エージェントのための小型円筒ディスプレイ(I. 画像認識・メディア理解)
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 解説 動的アクティブ探索法--室内中の物体を素早く探す技術
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 色ヒストグラム特徴とパン・チルト・ズームカメラを用いた高速物体探索法 : 動的アクティブ探索法 (画像の認識・理解論文特集)
- パン・チルト・ズームカメラによる物体探索のための最適撮影間隔の決定法
- D-12-3 色ヒストグラムを用いた実環境物体探索に関する一検討
- タブレット入力による手書き文字・図型認識
- TRECVID 2010 Instance Searchタスク参加報告 (パターン認識・メディア理解)
- IP映像配信サービス「4th MEDIA」(サービスの現状と将来展望,FTTHの進展とサービス展開)
- 多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法(音楽情報処理)
- 2値多重音響特徴ベクトルを用いた類似音楽探索とその高速化(マルチメディアパターン処理)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 多数の小区間信号の探索に基づく背景音楽の探索
- 多数の小区間信号の探索に基づく背景音楽の探索
- D-12-22 メディア探索のための曖昧文字列照合の高速計算法
- 類似度に基づく曖昧文字列照合法と音楽検索への適応
- D-12-71 誤検出特性を利用した非標識画像の自動収集による標識検出器の構築(D-12.パターン認識・メディア理解,一般セッション)
- D-12-64 姿勢変化に頑健な生成型学習法による歩行者検出(D-12.パターン認識・メディア理解,一般セッション)
- 口唇動作と音声の共起に着目した被写体と話者の不一致検出〜ニュース映像への適用と評価〜
- 摂動特徴量による顔画像に対する形状モデルフィッティング(画像認識,コンピュータビジョン)
- 顔の非剛体変形に頑健な複数フレーム超解像の検討
- 位置依存型識別器を用いた車載カメラ画像からの路面標示検出
- 認識・検出 顔属性に基づく学習型人物検索
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- マルチメディア情報の補足による初心者向け料理レシピの作成へ向けて(研究速報,マルチメディア情報の理解・変換・蓄積・加工・合成,料理を取り巻く情報メディア技術論文)
- マルチメディア料理レシピ作成のための料理レシピテキストと料理番組映像との対応付け(研究速報,マルチメディア情報の理解・変換・蓄積・加工・合成,料理を取り巻く情報メディア技術論文)
- 料理レシピマイニングによる代替可能食材の発見(研究速報,データマイニング,料理を取り巻く情報メディア技術論文)
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- シナリオに基づく複数の事例映像との対応付けによる結婚披露宴映像のシーン分割(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- シナリオに基づく複数の事例映像との対応付けによる結婚披露宴映像のシーン分割(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 適応的特徴選択を用いた入退室する人物の対応付け(一般セッション,文字・文書の認識と理解)
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告(テーマセッション,映像処理とTRECVID)
- Twitterの実況書き込みを利用したスポーツ映像の要約(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- Twitterの実況書き込みを利用したスポーツ映像の要約(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- Web上の大量の写真を画像分類して提示する観光マップの提案(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- Web上の大量の写真を画像分類して提示する観光マップの提案(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 位置によらない動き特徴を用いた遠隔共同調理映像問の動作対応付け(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- CHLAC特徴の周期性解析による料理映像中の繰り返し調理動作区間の抽出と識別(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- CHLAC特徴の周期性解析による料理映像中の繰り返し調理動作区間の抽出と識別(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 学習型局所画像変換に基づく顔向き変換手法に関する検討(一般セッション,文字・文書の認識と理解)
- R&Dホットコーナー ソリューション 分光画像撮影技術による文化財デジタルアーカイブ
- 2010年度PRMUアルゴリズムコンテスト : 「ターゲットをロックオンせよ!〜移動物体の追跡〜」実施報告と受賞アルゴリズム紹介(一般セッション,文字・文書の認識と理解)
- 位置によらない動き特徴を用いた遠隔共同調理映像間の動作対応付け(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- Web上の大量の写真に対する画像分類による観光マップの作成
- 大規模放送映像アーカイブにおける出現パターンによる準同一映像区間の分類
- 空撮画像を基準とした車載カメラ画像のモザイキングによる道路画像生成手法の検討(一般セッション,医用画像処理分野における計測・認識・理解)
- 空撮画像を基準とした車載カメラ画像のモザイキングによる道路画像生成手法の検討(一般セッション,医用画像処理分野における計測・認識・理解)
- 空撮画像を基準とした車載カメラ画像のモザイキングによる道路画像生成手法の検討(一般セッション,医用画像処理分野における計測・認識・理解)
- 非線形距離指標学習によるカメラ間人物照合(一般セッション,医用画像処理分野における計測・認識・理解)
- 非線形距離指標学習によるカメラ間人物照合(一般セッション,医用画像処理分野における計測・認識・理解)
- 非線形距離指標学習によるカメラ間人物照合(一般セッション,医用画像処理分野における計測・認識・理解)
- ドライバの視線情報を利用した運転行動予測(一般セッション,医用画像処理分野における計測・認識・理解)
- 生成型学習法を用いた姿勢変化に頑健な歩行者検出の検討(一般セッション,医用画像処理分野における計測・認識・理解)
- ドライバの視線情報を利用した運転行動予測(一般セッション,医用画像処理分野における計測・認識・理解)
- 生成型学習法を用いた姿勢変化に頑健な歩行者検出の検討(一般セッション,医用画像処理分野における計測・認識・理解)
- 生成型学習法を用いた姿勢変化に頑健な歩行者検出の検討(一般セッション,医用画像処理分野における計測・認識・理解)
- ドライバの視線情報を利用した運転行動予測(一般セッション,医用画像処理分野における計測・認識・理解)
- 口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)
- 非正面視点からの自己像を利用した対話インタフェースにおける指示容易性評価
- 複数画像系列の部分画像選択に基づく移動物体を含まない車載カメラ映像の生成(画像認識,コンピュータビジョン)
- 調理映像中の繰返し調理動作の検出(研究速報,映像メディア処理,画像符号化・映像メディア処理レター)
- コントラスト特徴とアピアランス特徴の統合による道路標識の視認性推定(画像認識,コンピュータビジョン)
- 過去のGPS衛星情報を利用した高精度位置推定 : 郊外路と都心部における検証(交通センシング、通信、情報処理、一般)
- 空撮画像と車載カメラ画像からの特徴点の時系列対応付けによる自車位置推定の高精度化(画像認識,コンピュータビジョン)
- 遡及型追跡に基づく標識画像の自動収集を用いた標識検出器の高精度化(画像・映像処理)
- 顔の非剛体変形に頑健な複数フレーム超解像の検討(一般セッション,コンピュータビジョンとパターン認識のための機械学習)
- 顔の非剛体変形に頑健な複数フレーム超解像の検討(一般セッション,コンピュータビジョンとパターン認識のための機械学習)
- 過去のGPS衛星情報を利用した高精度位置推定 : 郊外路と都心部における検証
- 部位スコアマップ統合による隠れにロバストな人体検出 (パターン認識・メディア理解)
- 音楽や映像を特定するメディア指紋技術とその応用(インダストリアルマテリアルズ)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 正確な色再現を目的とした2眼ステレオ式6バンドビデオシステム(テーマセッション,実時間処理実空間センシングと環境理解)
- 正確な色再現を目的とした2眼ステレオ式6バンドビデオシステム(テーマセッション,実時間処理実空間センシングと環境理解)
- 市街地構造物への拡張現実型画像情報提示手法
- 市街地構造物への拡張現実型画像情報提示手法