手書き数字列認識における文字列レベルでの識別器学習 : 文字とドキュメントの認識・理解)
スポンサーリンク
概要
- 論文の詳細を見る
我々はこれまで、切り出しと文字識別の統合型認識をベースに、単体文字識別と非文字の学習等の研究を進め、手書き数字列認識の精度を向上させてきた。本報告は、数字列認識で更なる精度向上を実現するため、文字列レベルでの識別器(パラメータ)の学習方法を実験的に評価検討したものである。学習処理では、文字列画像を動的に切出して文字識別を行い、パターンネットワーク上でパス探索を行うことで、パターン列候補を生成する。次にMCE (Minimum Classification Error)基準に基づき、切出したパターン列候補から文字列レベルで識別器を学習する。文字列レベルの識別器の学習効果を測定するため、幾つかの識別器に対して、NIST Special Database 19を用いて実験を行った。その結果、文字列レベルの学習により数字列の切出しミス低減を確認した。また、単体文字レベルで学習された識別器と文字列レベルで学習された識別器の適切な組合せにより数字列認識精度をさらに精度向上することができた。
- 社団法人電子情報通信学会の論文
- 2004-02-13
著者
関連論文
- I-85 帳票画像からの下線抽出の一手法(画像レイアウト解析,I.画像認識・メディア理解)
- D-12-60 帳票画像からの点線抽出の一手法
- 刊行物目次解析のための書誌情報表現の分析
- 文字と交差した罫線の除去方式の一提案
- 細分化クラスタ法によるパタンマッチングの高精度化
- 逐次型階層的クラスタリングによる大量学習の一手法
- 認識機能の出力あいまい性を許容した情報検索手法の一検討 : 認識誤り特性に着目した検索手法の分析評価
- 表罫線の交差部におけるかすれ補正方式の一提案
- 表記規則を持った数字列の一認識方法
- 文書認識と全文検索の融合技術に関する実験的検討
- 端点対接続型かすれ修復方法の手書き線図形認識への適用
- 表記規則を持つ数字文字列の認識における文字列チェック機能の一検討
- 手書き線図形のかすれ修復方法の一提案
- OCR誤認識後処理の効率化 : 補単語抽出方法と動詞活用処理を中心に
- 手書き漢字住所認識のためのエラー修正アルゴリズム
- 棒状図形に傾き検出のラン符号による高速化の一手法
- オートマトン型単語照合の姓名文字列への適用
- D-12-70 テロップ認識のための領域配置情報を用いた文字領域抽出(D-12. パターン認識・メディア理解,一般セッション)
- H-043 図形輪郭除去によるテロップ文字領域抽出(H分野:画像認識・メディア理解)
- 文書テンプレート再現のためのPDF文書構造化(膨大なデータから学ぶもの)
- 文書テンプレート再現のためのPDF文書構造化(テーマ,膨大なデータから学ぶもの)
- I_047 文書構造要約化による情報提供システム(I分野:画像認識・メディア理解)
- 帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解)
- 帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解)
- 適応型画像ベクトル照合に基づく金券識別(テーマセッション,文字認識・文書理解)
- 適応型画像ベクトル照合に基づく金券識別(テーマセッション,文字認識・文書理解)
- 言語情報を利用したオンライン枠なし手書き日本語文認識(スポーツ・運動映像のパターン認識・理解)
- OCRの文字切出し誤りを許容した文書検索システムの開発(文字とドキュメントの認識・理解)
- OCRの文字切出し誤りを許容した文書検索システムの開発(文字とドキュメントの認識・理解)
- D-12-36 印刷活字帳票における低品質文字列読取手法
- 手書き文字認識における学習型2次識別関数
- 手書き文字認識における学習型2次識別関数
- 表記パターン知識を用いた住所表示番号照合方式
- 日本語と欧米のオンライン手書き認識についての一サーベイ
- ニューラルネット及び統計的識別器を使った手書き数字認識における新しい知見
- ニューロ識別器のリジェクト能力を強化する識別学習方式
- 手書き数字列認識における文字列レベルでの識別器学習(文字とドキュメントの認識・理解)
- 手書き数字列認識における文字列レベルでの識別器学習 : 文字とドキュメントの認識・理解)
- オートマトン型単語照合の高速化手法
- 手書き文字認識のためのクラス特有特徴を用いた多項式識別関数
- 手書き文字認識のためのクラス特有特徴を用いた多項式識別関数
- ニューロ識別器のリジェクト能力を強化する識別学習方式
- 信頼度変換に基づく識別器複合化の研究(PRMU&NCテーマセッション(1) : 認識と学習)(認識と学習,模倣学習)
- 信頼度変換に基づく識別器複合化の研究(PRMU&NCテーマセッション(1) : 認識と学習)(認識と学習,模倣学習)
- 信頼度変換に基づく識別器複合化の研究
- 文書テンプレート再現のためのPDF文書構造化
- 文書テンプレート再現のためのPDF文書構造化