漢字画像から文字要素の自動抽出
スポンサーリンク
概要
- 論文の詳細を見る
計算機内に漢字の文字フォントを保持する方法として,漢字の字画に近い文字要素をデータの基本要素とし,これらの組み合わせで漢字を構成する要素組立法がある.この論文では,明朝体の漢字を対象とし,漢字全体に共通のあらかじめ設定した文字要素を漢字画像から抽出し,漢字の再構成に必要なデータを計算機により自動的に作成する方法について論じる.まず漢字画像に細線化を施すことにより,線図形としての構造と太さの情報を得る.それらを端点,交点,角を節とし,枝にはこれらの節を結ぶ線分(セグメント)を割り当てたグラフ構造を作成する.計算機内のグラフ構造における節や枝に,幾何学的な寸法,位置,形状などの情報を与える.次に,グラフ構造をたどって,隣り合うセグメントの形状や太さの変化を調べていくことにより,文字要素を構成する複数のセグメントの組み合わせを見出す.最終的にその組み合わされたものを文字要素とし,その形状の種類を決定し,再構成の時に必要な幾何学的なデータを取り込む.フォントサイズ384×384の明朝体の第一水準の漢字フォント2965個に適用した結果,認識率は77%であった.細線化,セグメントの統合,文字要素の識別,データの収集における問題点,およびその解決方法などについて論じられる.
- 1991-01-15
著者
関連論文
- 漢字画像データにおける横線と縦線の字画の抽出に基づく漢字フォントの自動生成
- 漢字画像デ-タからの漢字ドットパタ-ンの生成
- 漢字画像から文字要素の自動抽出
- (27) アセンブリ言語教育のためのX Window上でのマイクロコンピュータシミュレータの開発(第3セッション コンピュータ援用教育-I)
- 方向性距離変換に基づいた2値画像の高速細線化法
- 偏導関数自動計算のためのプリプロセッサの作成
- シュプリンガーの \TeX マクロパッケージ(数値解析とそのアルゴリズム)
- 方向性距離変換に基づいた細線化アルゴリズム
- 半無限区間振動積分の自動積分法--各種加速法を利用して
- パラメ-タを除いた有理式スプラインによる補間
- X Window環境下での68000マイクロコンピュ-タシミュレ-タ