変形推定に基づいた参照パターンの自動選択による文字認識
スポンサーリンク
概要
- 論文の詳細を見る
本報告では本棚上の本に印刷された文字を例に、情景内の文字をディジタルカメラで入力した場合などに見られる低品質な文字の認識について述べる。実環境で見られるこれらの文字では、照明などの撮影条件の変動により文字パターン形状が複雑に変動するため、入カパターンときれいな参照パターンとの単純な照合だけでは高精度に文字を認識することは困難である。我々は、あらかじめ様々な環境に対応した参照パターンを複数用意しておき、環境に対応した参照パターンを自動的に切り替えることにより認識する手法を提案する。雑誌の背に印刷されている低品質文字を対象に実験を行ったところ、きれいな参照パターンとの単純照合に比較して、認識精度は76.4%から82.8%に向上することを示す。連続する2文字の連結関係に基づく後処理と組み合わせることにより更に認識精度が向上することも示す。
- 社団法人電子情報通信学会の論文
- 1997-12-19
著者
-
萩田 紀博
エイ・ティ・アール知能ロボティクス研究所
-
村瀬 洋
NTT 基礎研究所
-
村瀬 洋
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
萩田 紀博
NTT コミュニケーション 科学基礎研究所
-
澤木 美奈子
NTT 基礎研究所
関連論文
- Twitterにおける実況書き込み検出手法の検討(映像コンテンツ,人工現実感)
- 調理動作に注目したマルチメディア料理レシピの提案(萌芽(生活メディア)セッション,生活メディア)
- 色変動を考慮した生成型学習法による道路標識検出器の構築(パターン認識応用,画像の認識・理解論文)
- 画像認識とGPU
- 空撮画像と時系列車載カメラ画像との照合による自車位置推定(テーマセッション関連,一般物体認識・画像特徴量)
- 複数映像統合による車載カメラ映像からの移動物体除去(一般セッション,一般物体認識・画像特徴量)
- 擬人化エージェントの印象操作のための視線制御方法(インタラクション技術の革新と実用化)
- D-7-7 診断サポートに向けた臨床データの健康度推定(D-7. MEとバイオサイバネティックス,一般セッション)
- 多数の顔画像を用いて顔向きの変換を行うView hallucinationの提案(一般セッション,一般物体認識・画像特徴量)
- 車載カメラを用いた道路標識の視認性推定のための画像特徴の検討(テーマセッション関連,一般物体認識・画像特徴量)
- 照明光の変動にロバストな色画像中の物体抽出
- 局所的な色照合を利用した映像からのキャラクタ検索
- D-12-49 超解像を用いた低解像度QRコード画像認識の検討(D-12.パターン認識・メディア理解,一般セッション)
- D-12-39 顕著度を考慮した歩行者の視認性定量化手法の検討(D-12.パターン認識・メディア理解,一般セッション)
- 属性に基づく学習型人物検索(画像認識,コンピュータビジョン)
- GPS生データの蓄積による高精度自車位置推定手法の提案 : 移動体における基礎検討(ITSポジショニング,一般)
- 運転者支援のための交通信号機視認性数値化手法
- 拡張DPマッチングを用いた視野角の異なるカメラ映像間の時空間対応付けによる自車位置推定(画像認識,コンピュータビジョン)
- D-12-34 Wikipediaエントリを用いたニュース字幕中の人物の名寄せ(D-12.パターン認識・メディア理解,一般セッション)
- 口唇動作特徴と音声特徴の共起性に基づく被写体と話者の不一致検出(萌芽(2):マルチメディア,日常生活におけるメディア技術)
- 実用化に向けた顔画像処理技術(特別講演,顔・人物・ジェスチャ・行動)
- 実用化に向けた顔画像処理技術(特別講演,顔・人物・ジェスチャ・行動)
- 料理レシピをわかりやすくするための理解困難な表現の補足(料理・メディア,デジタルミュージアムとエンタテイメントメディア)
- フレーム選択型超解像処理を用いた低解像度文字認識手法の提案(一般,顔・人物・ジェスチャ・行動)
- フレーム選択型超解像処理を用いた低解像度文字認識手法の提案(一般,顔・人物・ジェスチャ・行動)
- ニュース映像間の時系列意味構造を利用したWikipedia記事のマルチメディア化(料理・メディア,デジタルミュージアムとエンタテイメントメディア)
- ジオタグ付き写真を用いた風景カテゴリマップ作成手法の検討(複合現実感,仮想都市)
- 2値パターン拘束と超解像を組み合わせた低解像度QRコード認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 2値パターン拘束と超解像を組み合わせた低解像度QRコード認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 画像特徴と音声特徴の統合利用による結婚式映像のシーン分類(萌芽(2):マルチメディア,日常生活におけるメディア技術)
- 複数の画像特徴の統合による道路標識の視認性推定手法 : 車載カメラ画像への適用と評価
- 複数の画像特徴の統合による道路標識の視認性推定手法 : 車載カメラ画像への適用と評価(交通センシング,交通センシング、通信、情報処理、一般)
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法(画像処理, 画像パターン認識)
- 歩行動作特性からの年齢層の推定
- ユーザとのコミュニケーションにおける擬人化エージェントの視線移動制御
- 劣化推定に基づいた辞書の自動選択による本棚画像中の文字認識
- テンプレート学習による本棚画像中の文字認識
- 複数情報が重畳した尺八譜認識に関する一検討
- 周囲文字を含んだ参照パターンによる本棚画像中の文字認識
- 辞書の自動選択による本棚画像中の文字認識
- 変形推定に基づいた参照パターンの自動選択による文字認識
- 複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出(一般,顔・人物・ジェスチャ・行動)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化(テーマ関連,顔・人物・ジェスチャ・行動)
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出(一般,顔・人物・ジェスチャ・行動)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化(テーマ関連,顔・人物・ジェスチャ・行動)
- D-12-72 動画像を用いた一般物体のカテゴリ識別に関する検討(D-12.パターン認識・メディア理解,一般セッション)
- D-12-20 HOG特徴を用いた映像中の人物の周期的動作検出に関する検討(D-12.パターン認識・メディア理解,一般セッション)
- 車載カメラ映像からの学習サンプルの自動収集による標識検出器の高精度化に関する検討(一般セッション,文字・文書の認識・理解)
- 背景差分法による物体検出を目的とした逐次モンテカルロ法による背景推定(画像・映像処理)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- ディジタルカメラのズーム機能を利用した文字認識
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 撮影距離の変化に対する情景内文字の認識特性
- D-12-6 ランレングス補正に基づく劣化手書き文字認識のための特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- 「パターン認識・理解」から「パターン認識・メディア理解」へ
- Twitterにおける実況書き込み検出手法の検討(映像コンテンツ,人工現実感)
- 人物検出を目的とした照明変化に応じた背景画像の生成
- I-39 全方位カメラと複数のマイクロホンを用いた話者の検出(全方位画像解析・ロボットビジョン,I.画像認識・メディア理解)
- 多値画像中の文字列切り出しに関する一検討
- 劣化文字にロバストな識別関数の学習に関する検討
- 特徴補正に基づくカテゴリー依存特徴抽出法による映像中文字認識(画像認識,コンピュータビジョン)
- 画質劣化文字認識のためのカテゴリに依存した特徴抽出法
- 単音連繋確率ネットワークに基づく音楽演奏の音源同定
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現
- ユビキタスマーケットプラットフォームにおける店舗内外連携による顧客案内動作の実現
- DP-1-3 異種ロボット連携による買い物支援(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- DP-1-2 ユビキタスネットワークロボット研究開発プロジェクト : 全体像と中間成果総括(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- デザイン処理された新聞見出し画像の文字認識法
- 補完類似度に基づく新聞見出し文字の領域抽出と認識
- 補完類似度による劣化印刷文字認識
- 補完類似度による低品質文字認識--文字を認識するコンピュ-タ (特別企画 ヒュ-マノイドテクノロジ&サイエンス)
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現(ライフサポート,グループウェアとネットワーク,ライフログ活用技術,一般)
- コミュニケーションロボットによる領域参照のための直示的インタラクションのモデル化
- 複数の案内ロボットが連携してサービス提供するネットワークロボットシステムの実現
- twitterを用いた即応性の高いQ&A仲介エージェントの提案(一般セッション(1),クラウドでつながるロボットサービス)
- ロボットの能動的接触は人間のモチベーションを上げるか(エージェントデザイン,人とエージェントのインタラクション論文)
- コミュニケーションロボットのための発話とジェスチャのアサインパターンの抽出とその発展的開発手法の提案(対話生成,人とエージェントのインタラクション論文)
- 人々との身体的なインタラクションを行う小型ロボットのための慣性センサを用いた個人同定手法の確立(ユーザ状態推定,人とエージェントのインタラクション論文)
- ロボット発話の冗長性制御による指示物体認識性能向上への寄与
- 店舗内での顧客の停留領域系列に基づいたロボットからの商品推薦(知能ロボット,ライフログ処理技術とその活用システム論文)
- クラウドによるロボットの発話とジェスチャのアサインパターンの抽出とその発展的開発手法(地理空間情報とロボットと人と)
- 対話行動認識プラットフォーム
- DP-1-3 多地点を連携して動くロボットサービス実証実験 : ユビキタスネットワークロボット・プラットフォーム(DP-1.クラウドネットワークロボットのワイガヤ実験場の実現に向けて,パネルセッション,ソサイエティ企画)
- コミュニケーションロボットによる道案内 : ジェスチャの有用性と発話タイミングのモデル化(人工知能,データマイニング)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 顧客の軌跡データを利用した実購買行動解析による購買・非購買推定(行動解析,ユーザ属性情報,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)