多段弾性照合法の郵便あて名区分機への応用
スポンサーリンク
概要
- 論文の詳細を見る
郵便あて名区分機は、あて名情報の自動読み取りにより、配達区分作業の効率化を目的とした装置である。配達区分とは、郵便番号単位に区分された郵便物に対して、町〜丁目〜番レベルの情報を読み取り、細区分する処理である。現在、NECの郵便あて名区分機は、手書き・印刷混在郵便物に対する自動区分を実現している。手書き漢字認識技術は、郵便あて名区分機において核となる技術であり、非線形正規化・非線形マッチングからなる多段弾性照合法を適用した。従来、手書き漢字認識では、字種が多い、字形が複雑である、類似文字が多い、変形が多様である、という大きく4つの課題があるが、あて名区分機への応用においては特性が異なる。まず読み取り対象の郵便物が自由書式であり、文字の切り出し位置の特定が困難なため、(1)切り出し誤り文字が入力される場合が多い。次に不特定多数の筆記者が様々の筆記具で記入した自由手書き文字を対象とするため、(2)文字の変形が極めて多様である。また、市区町名情報は漢字で、丁目番などの街区情報は数字であるため、(3)字形の複雑な漢字と単純な数字が混在する。但し、郵便番号単位に粗区分された郵便物を細区分する処理であるため、(4)対象とする住所は限られ住所知識を利用でき、また文字種も50〜500程度と比較的少ないなど、一般の文書読み取りと比べ有利な点もある。今回、個別文字認識とあて名読み取り性能の関係について分析し、個別文字認識性能があて名読み取り性能、特に誤区分率に大きく影響すること、および個別文字認識処理と知識処理の整合性が重要であることを示す。
- 社団法人電子情報通信学会の論文
- 1995-09-05
著者
-
長谷川 武司
Nec
-
山内 俊史
日本電気株式会社産業オートメーション事業部
-
山内 俊史
NEC産業オートメーション事業部
-
山内 俊史
Nec
-
板本 康治
NEC産業オートメーション事業部
-
長谷川 武司
NEC産業オートメーション事業部
-
高橋 正人
NECポスタルテクノレクス(株)
-
辻 善丈
NEC産業オートメーション事業部
-
津雲 淳
NEC情報メディア研究所
-
高橋 正人
富士電機株式会社ファインテック機器部開発設計課
関連論文
- 仮説生成と検証の効率的組合せに基づく手書き文字列読み取り向け知識処理方式
- 認識知識処理 (認識と制御技術 特集)
- ボトムアップ/トップダウン処理を融合した手書き文字列読み取り知識処理
- 手書き文字列読み取りのための単語連鎖制約に基づく効率的探索と棄却
- 効率的探索とトップダウン的検証を組み合わせた手書き住所読み取り知識処理
- 多段弾性照合法の郵便あて名区分機への応用
- ソフトウェア開発における進捗管理方法の一例
- C-6-13 高発熱密度を有する電子デバイスの冷却特性に関する検討
- 手書き漢字認識 (日本語処理技術特集) -- (マルチモ-ダルインタフェ-ス技術)
- スプリット検出法による文書画像構造解析