Face recognition based on virtual frontal view generation using LVTM with local patches clustering
スポンサーリンク
概要
- 論文の詳細を見る
One of the major difficulties encountered by face recognition is the varying poses caused by in-depth rotations. The intra-person appearance differences caused by rotations are often larger than the inter-person differences, which makes the traditional face recognition methods such as eigen-face infeasible. This paper presents a framework for face recognition across pose based on virtual frontal view generation using Local View Transition Model(LVTM) with local patches clustering. Previous study on LVTM shows that more accurate appearance transition model can be achieved by first dividing the original face image plane into overlapping local patch regions and then the learned transition models for each patch are aggregated for the final transformation. In this paper we show that the accuracy the appearance transition model and the recognition rate can be further improved by better exploiting the inherent linear relationship between frontal-nonfrontal face image pairs. This is achieved based on the observation that variations in appearance caused by pose are closely related to the corresponding 3D face structure and intuitively frontal-nonfrontal pairs from more similar local 3D face structures should have a stronger linear relationship. For each specific location, instead of learning a common transformation as in LVTM, the corresponding local patches are first clustered based on appearance similarity distance metric and then the transition models are learned separately for each cluster. In the testing stage, each local patch for the input nonfrontal probe image is transformed using the learned local view transition model corresponding to the most visually similar cluster. The experimental results on real life face dataset demonstrate the effectiveness of the proposed method.
- 2012-02-02
著者
-
TAKAHASHI Tomokazu
Graduate School of Information Science, Nagoya University
-
IDE Ichiro
Graduate School of Information Science, Nagoya University
-
Murase Hiroshi
Department Of Media Science Graduate School Of Information Science Nagoya University
-
Ide Ichiro
Department Of Media Science Graduate School Of Information Science Nagoya University
-
Takahashi Tomokazu
Faculty Of Economics And Information Gifu Shotoku Gakuen University
-
Deguchi Daisuke
Graduate School of Information Science, Nagoya University
-
Deguchi Daisuke
Graduate School Of Information Science Nagoya University
-
Murase Hiroshi
Graduate School Of Information Science Nagoya University
-
LI Xi
Graduate School of Information Science, Nagoya University
-
Ide Ichiro
Graduate School Of Information Science Nagoya University
-
Li Xi
Graduate School Of Information Science Nagoya University
-
Takahashi Tomokazu
Graduate School Of Information Science Nagoya University:faculty Of Economics And Information Gifu Shotoku Gakuen University
-
LI Xi
Graduate School of Agriculture, Hokkaido University
関連論文
- Combining Three Different Types of Local Features for Generic Object Recognition(International Session 1)
- Incremental Unsupervised-Learning of Appearance Manifold with View-Dependent Covariance Matrix for Face Recognition from Video Sequences
- Construction of Appearance Manifold with Embedded View-Dependent Covariance Matrix for 3D Object Recognition
- Generation of Training Data by Degradation Models for Traffic Sign Symbol Recognition(Image Recognition and Understanding)
- Appearance Manifold with Covariance Matrix for 3-D Object Recognition(CV)
- THREE-DIMENSIONAL PARALLEL IMAGE PROCESSING LIBRARY(International Workshop on Advanced Image Technology 2007)
- THREE-DIMENSIONAL PARALLEL IMAGE PROCESSING LIBRARY
- Human Spine Posture Estimation from 2D Frontal and Lateral Views Using 3D Physically Accurate Spine Model (ME and Human Body) (Machine Vision Applications)
- Human Spine Posture Estimation from 2D Frontal and Lateral Views Using 3D Physically Accurate Spine Model
- Self-Organization of Spatio-Temporal Visual Receptive Fields
- Microsatellite markers reveal high allelic variation in natural populations of Cryptomeria japonica near refugial areas of the last glacial period
- Sexual Attitudes of the Adolescent in Japan Today
- A Study of Mach--Zehnder Interferometer Type Optical Modulator Applicable to an Accelerometer
- Evaluation of a prostate biopsy strategy for cancer detection using a computer simulation system with virtual needle biopsy for three-dimensional prostate models
- 生活支援 マルチメディア料理レシピのための料理テキストと料理番組映像との対応付け
- D-12-93 雨天時の信号機視認性推定のための画像特徴に関する予備的検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-12-64 印象に基づく属性による顔画像の検索に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-12-63 体に対する顔の向きと視線方向の関係に関する予備的調査(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-12-62 顔向き変化を利用した超解像 : 顔向き範囲が超解像に与える影響の調査(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- 生成型学習法を用いた傘をさした歩行者の高精度な検出に関する検討 (パターン認識・メディア理解)
- 生成型学習法を用いた傘をさした歩行者の高精度な検出に関する検討 (情報論的学習理論と機械学習)
- Face recognition based on virtual frontal view generation using LVTM with local patches clustering (パターン認識・メディア理解)
- Face recognition based on virtual frontal view generation using LVTM with local patches clustering
- Efficient Tracking of News Topics Based on Chronological Semantic Structures in a Large-Scale News Video Archive
- Efficient Tracking of News Topics Based on Chronological Semantic Structures in a Large-Scale News Video Archive
- 自車位置推定のための車載カメラ映像と市街地映像データベースの位置ずれや遮へいに頑健なフレーム対応付け(画像認識,コンピュータビジョン)
- Face recognition based on virtual frontal view generation using LVTM with local patches clustering
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 過去の車載カメラ映像との時空間差分による不特定障害物検出に関する検討(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 過去の車載カメラ映像との時空間差分による不特定障害物検出に関する検討(一般セッション,人の視聴覚情報処理とPRMUの接点)
- ショット内及びショット間の画像・音声特徴に着目したスピーチショット抽出(映像(1),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- ニュース映像中の同一シーン検出のための領域別照合手法の検討(映像(1),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 低解像度QRコード認識のための2値グリッド拘束付き2段階超解像(画像認識,コンピュータビジョン)
- 車載カメラを用いた走行環境適応型歩行者検出器に関する予備的検討
- 時間的冗長性の除去による調理履歴映像の要約(食のメディア処理と分析,データ工学と食メディア)
- 生成型学習法を用いた傘をさした歩行者の高精度な検出に関する検討
- 3. 実世界シナリオに基づく映像の再編纂(放送とソーシャルメディア)
- Cross-Pose Face Recognition — A Virtual View Generation Approach Using Clustering Based LVTM
- スポーツハイライト映像作成のためのTwitter熱狂度に基づいたイベント検出 (マルチメディア・仮想環境基礎)
- スポーツハイライト映像作成のためのTwitter熱狂度に基づいたイベント検出 (福祉情報工学)
- スポーツハイライト映像作成のためのTwitter熱狂度に基づいたイベント検出 (画像工学)
- スポーツハイライト映像作成のためのTwitter熱狂度に基づいたイベント検出 (イメージ・メディア・クオリティ)
- ニューストピックの時系列意味構造における主要なストーリ遷移の推定 (マルチメディア・仮想環境基礎)
- 料理レシピの記述に従った家庭内調理映像の要約 (マルチメディア・仮想環境基礎)
- ニューストピックの時系列意味構造における主要なストーリ遷移の推定 (福祉情報工学)
- 料理レシピの記述に従った家庭内調理映像の要約 (福祉情報工学)
- ニューストピックの時系列意味構造における主要なストーリ遷移の推定 (画像工学)
- ニューストピックの時系列意味構造における主要なストーリ遷移の推定 (イメージ・メディア・クオリティ)
- 料理レシピの記述に従った家庭内調理映像の要約 (画像工学)
- 料理レシピの記述に従った家庭内調理映像の要約 (イメージ・メディア・クオリティ)
- CARDIAC ACTIVE STEROIDS AND THE SLOW MUSCLE FIBRE
- P23-13 Evaluating spatial and temporal variation in global warming potential (GWP) at a regional scale in Ikushunbetsu river watershed, Hokkaido Japan
- 音声特徴と画像特徴を利用したニュース映像からの同一場面検出 (マルチメディア・仮想環境基礎)
- 料理レシピの記述に従った家庭内調理映像の要約(食メディア(レシピ),メディア・コミュニケーションの品質と福祉,及び一般)
- 車載カメラとGPSを組み合わせた走行環境適応型歩行者検出器に関する検討(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- D-12-75 歩行者の見つけやすさ推定の個人適応に関する予備的検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス))
- 頭部姿勢を考慮した視線方向推定に関する検討(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- 大量の画像付き料理レシピからの学習による料理に含まれる素材推定(食メディア(レシピ),メディア・コミュニケーションの品質と福祉,及び一般)
- D-12-50 赤外線センサアレイを用いた複数点熱源の位置推定に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス))
- D-12-19 監視カメラによる人物画像からの手荷物認識に関する検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成))
- ニューストピックの時系列意味構造における主要なストーリ遷移の推定(映像メディア,メディア・コミュニケーションの品質と福祉,及び一般)
- 料理レシピの補足情報における味に関するコツの抽出(食メディア(レシピ),メディア・コミュニケーションの品質と福祉,及び一般)
- D-12-98 視体積交差法を用いた複数カメラからの人数推定に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス))
- スポーツハイライト映像作成のためのTwitter熱狂度に基づいたイベント検出(映像メディア,メディア・コミュニケーションの品質と福祉,及び一般)
- 高精度な道路標識検出器構築のための重み付き投票型Co-training手法の提案 (パターン認識・メディア理解)
- 位置情報を用いた走行環境適応による車載カメラ画像からの歩行者検出の高精度化 (パターン認識・メディア理解)
- 顔の部分領域別動き照合によるニュース映像からの同一場面検出 (画像工学)
- 顔の部分領域別動き照合によるニュース映像からの同一場面検出 (マルチメディア・仮想環境基礎)
- 顔の部分領域別動き照合によるニュース映像からの同一場面検出 (イメージ・メディア・クオリティ)
- Shedding of herpes simplex virus type 1 into saliva after surgery for oral and genital or urological cancer parients.
- 低解像度人体画像の学習型超解像に関する検討(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)
- 1-1-4 Simulation of Daily CO_2 fluxes using a Bayesian hierarchical model at the regional scale in central Hokkaido, Japan
- RGB-D情報を同時取得可能な単一撮像素子を用いた人物向きの推定に関する予備的検討
- マイクロブログへの投稿に基づく政治家の立場推定