携帯ディジタルカメラにより撮影された動画像からの低解像度文字認識(画像認識,コンピュータビジョン)
スポンサーリンク
概要
- 論文の詳細を見る
近年,ディジタルビデオカメラやカメラ付き携帯電話といった,動画像を容易に撮影可能なディジタル撮影機器が急激に普及している.これらの機器により撮影された画像を用いて文字を認識する技術は,マン・マシンインタフェースにおいて有用な要素技術となる.しかし,これらの撮影機器で紙面等に印刷された文書全体を一度に撮影した場合,各文字は非常に低解像度なものになってしまい,また,手ぶれなどの影響で画像がぶれてしまうことがある.そのため,このような低品質の文字を1枚の画像のみから認識するのは困難である.本論文では,動画像中の複数フレームの画像を入力に用いて,各画像の情報を部分空間法により統合し,認識精度を向上させる多入力型ロバスト部分空間法を提案する.本手法は認識時に,複数枚の入力サンプルの分布情報を用いて,サンプルに対して重みを与えることで,誤認識を誘発する例外サンプルの影響を抑制し,認識精度の向上を図るものである.ディジタルビデオカメラとカメラ付き携帯電話を用いた文字認識実験により,動画像から得られた連続した複数の入力画像を用いることで,認識率の向上と入力サンプルへの重み付けの有効性を確認した.
- 社団法人電子情報通信学会の論文
- 2006-02-01
著者
-
井手 一郎
名古屋大学大学院情報科学研究科
-
村瀬 洋
名古屋大学大学院情報科学研究科
-
目加田 慶人
中京大学生命システム工学部
-
高橋 友和
名古屋大学hyarc:(現)ノックスデータ株式会社
-
柳詰 進介
名古屋大学大学院情報科学研究科
-
柳詰 進介
名古屋大学大学院情報科学研究科:現在 (株)リコー
-
井手 一郎
名古屋大学
-
村瀬 洋
名古屋大学
-
高橋 友和
名古屋大学
関連論文
- Twitterにおける実況書き込み検出手法の検討(映像コンテンツ,人工現実感)
- 調理動作に注目したマルチメディア料理レシピの提案(萌芽(生活メディア)セッション,生活メディア)
- 色変動を考慮した生成型学習法による道路標識検出器の構築(パターン認識応用,画像の認識・理解論文)
- 画像認識とGPU (特集 ロボットを進化させる最先端IT技術)
- 2.献立を決める(生活に役立つメディア処理-料理行動を科学する-)
- 献立を決める
- 画像認識とGPU
- セマンティックギャップを越えて : 画像・映像の内容理解に向けて
- 空撮画像と時系列車載カメラ画像との照合による自車位置推定(テーマセッション関連,一般物体認識・画像特徴量)
- 一般物体認識のためのマルチモーダル星座モデル(パターン認識と学習,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 運転者支援のための交通信号機視認性数値化手法
- 街並み画像系列と2台の車載カメラの画像系列との照合による自車の走行位置推定(テーマセッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 複数映像統合による車載カメラ映像からの移動物体除去(一般セッション,一般物体認識・画像特徴量)
- 車載カメラ映像からの学習サンプルの自動収集による標識検出器の高精度化に関する検討 (パターン認識・メディア理解)
- 放送映像における準同一映像区間の出現パターンによる分類(一般セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 放送映像における準同一映像区間の出現パターンによる分類(一般セッション4)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化 (ヒューマン情報処理)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化 (パターン認識・メディア理解)
- 木構造解析による胸部X線CT像からの肺動脈・肺静脈の自動分類(ポスター2, 医用画像一般)
- 車載レーザスキャナによる距離データマップの構築と高精度自車位置推定(パターン認識)
- ドライバの注視行動を利用した視線計測システムの自動校正(インタラクション・VR,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 適応的特徴選択を用いた長時間放送映像からの高速な繰り返し区間検出(一般セッション14)
- 適応的特徴選択を用いた長時間放送映像からの高速な繰り返し区間検出(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- 大量ニュース映像を対象とした時系列意味構造に基づく情報編簒手法の提案
- 複数モデルの動的選択に基づく気管支枝名自動対応付け手法(アトラス,医用画像論文)
- 一般物体認識のためのタイプの異なる局所特徴の統合利用(パターン認識)
- ニュース映像の検索
- 多数の顔画像を用いて顔向きの変換を行うView hallucinationの提案(一般セッション,一般物体認識・画像特徴量)
- 車載カメラを用いた道路標識の視認性推定のための画像特徴の検討(テーマセッション関連,一般物体認識・画像特徴量)
- 料理レシピ中の初心者に理解困難な表現の抽出(生活メディアセッション,生活メディア)
- A-16-1 料理レシピにおける形容表現抽出手法の検討(A-16.マルチメディア・仮想環境基礎,一般セッション)
- A-16-2 画像特徴の時間変化に基づく料理映像の分類(A-16.マルチメディア・仮想環境基礎,一般セッション)
- D-12-90 2枚の顔画像から正面顔を推定する手法に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- 3.料理メディア : 台所におけるディジタルコンテンツの処理と利用(ディジタルコンテンツ制作の最新動向〜ここまで来たディジタルコンテンツ制作〜)
- 映像アーカイブとファインダビリティ(デジタル映像アーカイブ)
- D-12-49 超解像を用いた低解像度QRコード画像認識の検討(D-12.パターン認識・メディア理解,一般セッション)
- D-12-39 顕著度を考慮した歩行者の視認性定量化手法の検討(D-12.パターン認識・メディア理解,一般セッション)
- 拡張DPマッチングを用いた視野角の異なるカメラ映像間の時空間対応付けによる自車位置推定
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出 (ヒューマン情報処理)
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出 (パターン認識・メディア理解)
- 運転者支援のための交通信号機視認性数値化手法
- データ工学とメディア理解との融合 : 大量データにおけるパターン情報を扱う新しい枠組みは?(テーマセッション(1),データ工学とメディア理解との融合)
- データ工学とメディア理解との融合 : 大量データにおけるパターン情報を扱う新しい枠組みは?(テーマセッション(1),データ工学とメディア理解との融合)
- H-002 超解像処理を用いた低解像度文字の認識(画像認識・メディア理解,一般論文)
- D-12-110 局所特徴を用いた猫の顔検出に関する予備的検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-12-116 入退室解析のための色特徴を用いた人物対応付けに関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- D-12-132 車載カメラ映像から多様な標識画像を収集するための逆方向追跡に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- 色変動を考慮した生成型学習法を用いたカスケード型標識検出器(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- 生成型学習法を用いた車載カメラ画像からの路面標示認識
- 生成型学習法を用いた車載カメラ画像からの路面標示認識(一般セッション,システム・制御のためのパターン認識・メディア理解)
- H-038 過去の車載カメラ映像との差分による前方車両の検出(画像認識・メディア理解,一般論文)
- 自車位置推定のための車載全方位カメラ映像と通常カメラ映像のフレーム間対応付け(一般セッション8)
- 自車位置推定のための車載全方位カメラ映像と通常カメラ映像のフレーム間対応付け(一般セッション3,三次元画像,多視点画像)
- 自車位置推定のための車載全方位カメラ映像と通常カメラ映像のフレーム間対応付け(一般セッション3,三次元画像,多視点画像)
- 車載カメラ映像とミリ波レーダデータによる霧の濃さの判定(一般セッション2(ITS),文字・文書の認識・理解)
- 運転支援のための車載カメラ映像による状況別降雨認識(一般セッション7)
- 運転支援のための車載カメラ映像による状況別降雨認識(一般セッション7)
- 運転支援のための車載カメラ映像による状況別降雨認識(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- D-12-49 車載カメラとミリ波レーダによる霧状況下の視認性の推定(D-12.パターン認識・メディア理解,一般講演)
- D-12-49 車載カメラとミリ波レーダによる霧状況下の視認性の推定(D-12.パターン認識・メディア理解,一般講演)
- Twitter における実況書き込み検出手法の検討
- 拡張DPマッチングを用いた視野角の異なるカメラ映像間の時空間対応付けによる自車位置推定(画像認識,コンピュータビジョン)
- D-12-90 生成型学習とカスケード型識別器による交通標識検出(D-12. パターン認識・メディア理解,一般セッション)
- D-12-34 Wikipediaエントリを用いたニュース字幕中の人物の名寄せ(D-12.パターン認識・メディア理解,一般セッション)
- ニュース映像アーカイブにおけるキーショットの抽出と索引付け(テーマセッション: 映像インデクシング, データ工学とメディア理解との融合)
- ニュース映像アーカイブにおけるキーショットの抽出と索引付け(テーマセッション: 映像インデクシング, データ工学とメディア理解との融合)
- フレーム選択型超解像処理を用いた低解像度文字認識手法の提案(一般,顔・人物・ジェスチャ・行動)
- フレーム選択型超解像処理を用いた低解像度文字認識手法の提案(一般,顔・人物・ジェスチャ・行動)
- ジオタグ付き写真を用いた風景カテゴリマップ作成手法の検討(複合現実感,仮想都市)
- 2値パターン拘束と超解像を組み合わせた低解像度QRコード認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 2値パターン拘束と超解像を組み合わせた低解像度QRコード認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 複数の画像特徴の統合による道路標識の視認性推定手法 : 車載カメラ画像への適用と評価
- 複数の画像特徴の統合による道路標識の視認性推定手法 : 車載カメラ画像への適用と評価(交通センシング,交通センシング、通信、情報処理、一般)
- D-12-91 車載レーザレーダを用いたフレーム間差分及びL字形状判別による移動車両検出(D-12. パターン認識・メディア理解,一般セッション)
- 車載レーザスキャナを用いた距離データマップの構築と高精度自車位置推定(ITS画像処理,映像メディア及び一般)
- 車載レーザスキャナを用いた距離データマップの構築と高精度自車位置推定(ITS画像処理,映像メディア及び一般)
- 距離データ系列の照合による自車位置推定と走行車線認識(一般セッション2)
- 距離データ系列の照合による自車位置推定と走行車線認識(一般セッション2,顔・ジェスチャの認識・理解)
- 距離データ系列の照合による自車位置推定と走行車線認識(一般セッション2,顔・ジェスチャの認識・理解)
- レーザレーダデータ系列間対応付けによる自車位置推定(テーマセッション(2),データ工学とメディア理解との融合)
- レーザレーダデータ系列間対応付けによる自車位置推定(テーマセッション(2),データ工学とメディア理解との融合)
- D-12-50 レーザレーダデータ間の対応付けによる自車位置情報の精度向上の検討(D-12.パターン認識・メディア理解,一般講演)
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出(一般,顔・人物・ジェスチャ・行動)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化(テーマ関連,顔・人物・ジェスチャ・行動)
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出(一般,顔・人物・ジェスチャ・行動)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化(テーマ関連,顔・人物・ジェスチャ・行動)
- D-12-72 動画像を用いた一般物体のカテゴリ識別に関する検討(D-12.パターン認識・メディア理解,一般セッション)
- D-12-20 HOG特徴を用いた映像中の人物の周期的動作検出に関する検討(D-12.パターン認識・メディア理解,一般セッション)
- 車載カメラ映像からの学習サンプルの自動収集による標識検出器の高精度化に関する検討(一般セッション,文字・文書の認識・理解)
- 5ZK-4 映像の同一性に着目した同一ニュースイベントの言語横断検索(情報爆発時代におけるマルチメディアデータと位置依存情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 5ZK-2 大規模ニュース映像アーカイブにおける繰り返し映像区間の出現傾向分析(情報爆発時代におけるマルチメディアデータと位置依存情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 5ZK-1 特徴空間の適応的分割による繰り返し映像区間検出の高速化(情報爆発時代におけるマルチメディアデータと位置依存情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 繰り返し映像区間検出を高速化するための特徴空間の適応的分割(一般セッション2)
- 画像とテキストの利用による同一ニュースの言語横断検索(一般セッション2)
- D-12-89 生成型学習を用いた車載カメラ映像中の路面標示認識の検討(D-12. パターン認識・メディア理解,一般セッション)
- 繰り返し映像区間検出を高速化するための特徴空間の適応的分割(一般セッション1,三次元画像,多視点画像)
- 画像とテキストの利用による同一ニュースの言語横断検索(一般セッション1,三次元画像,多視点画像)
- 繰り返し映像区間検出を高速化するための特徴空間の適応的分割(一般セッション1,三次元画像,多視点画像)
- 画像とテキストの利用による同一ニュースの言語横断検索(一般セッション1,三次元画像,多視点画像)
- 複数カメラ入力によるアピアランスベース物体認識のためのカメラ配置決定手法(パターン認識と理解,画像の認識・理解論文)