動的な仮説生成・検証による日本語印刷文書からの文字の切り出し
スポンサーリンク
概要
- 論文の詳細を見る
本稿では日本語で印刷された新聞・雑誌・書籍等の一般活字文書から文字を切り出す方式について述べる。日本語の一般活字文書においては、文字の大きさやピッチが変動すること、文字の接触やかすれがあること、分離文字や合成文字があること、英数字が混在すること等の問題点があり、従来提案されている方法では十分な性能が得られていなかった。本方式は、容易に切り出せる文字から先に切り出し、その結果得られた情報を用いて、段階的により困難な文字を切り出すこと、および各段階において複数の切り出し方法の仮説を立て、それらを文字認識結果で検証することに特徴がある。本方式により、高い精度で、しかも効率良く文字を切り出せることが、実験によって示された。
- 社団法人電子情報通信学会の論文
- 1993-09-16