日本語活字フォントの識別
スポンサーリンク
概要
- 論文の詳細を見る
高度化する文書認識/再現技術において文字画像に対して文字コードのみならず、そのフォントやサイズを識別する技術が求められている。フォント識別技術は文書画像の忠実な再現やOCRの辞書の切り替え、キーワードの自動抽出といった応用に対して非常に有用である。本報告では識別対象のフォントを明朝体とゴシック体に限定し、文字種毎の辞書や文字コードの情報を使わずにこれらを識別する方式を提案する。ランレングスヒストグラムやストロークの幅とその変化率、セリフの抽出など様々な特徴量を用いたロバストな方式となっている。本方式を多くの文書画像データベースに対して実験を行ない、その有効性を検証した。
- 1997-03-19