目次ページの判別と領域分割
スポンサーリンク
概要
- 論文の詳細を見る
筆者らはこれまで汎用を目指したOCRの開発を行ってきた。汎用という言葉には、視覚障害者を含めた多くの人に、そしてまた1枚文書に限らず雑誌、本なども読むことができるという2通りの意味がある。さらに、雑誌や本では見開きページの入力に対し、ページ単位の処理ができ、横書きや縦書きにも対応できるように設計されている。しかし、この自在な機能のため、縦書き本の目次ページのように文字数が少なくかつ章・節の題目の下に横書き数字でページ数が書かれていると、図1に示すようにページ数の行が横書き行として行分割されてしまう。この現象は市販のOCRにおいても現れている。下位の処理でこのような誤りをすると、上位の目次構造の認識・理解はかなり困難になる。これを防ぐためには目次構造ページであるという事前知識の下で領域分割を行う必要があると考えられる。本稿では、初期の領域分割の結果を利用して、そのページが目次構造であるか否かを判定し、もしそうであれば再度領域分割をしなおして正しい分割結果を得るための方法について報告する。
- 社団法人電子情報通信学会の論文
- 1996-09-18
著者
関連論文
- 不完全な同期下の単純セルオートマトンの時空間パターンによる分類(情報・システム基礎)
- Langtonの自己増殖ループの形態的進化
- 16セグメントディスプレイ上の英字パターンの一斉射撃問題
- 7セグメントディスプレイ上の数字パターンの一斉射撃問題
- 回転ミラーヘッド顕微鏡像群からの3次元形状再構成の一手法(感性情報処理とマルチメディア技術および一般)
- 2視点撮影画像に基づく仮想視点画像生成の三次元的自由度への拡張
- LI-011 固有ベクトルの変動を考慮した共分散行列(I. 画像認識・メディア理解)
- 降雪状况に適応的な降雪粒子のリアルタイム除去
- 時間メディアンフィルタによる降雪ノイズ除去
- 段階的弛緩法による文字列抽出
- 高解像度入力したカラー印刷文書画像に現れる網点ノイズの効果的軽減手法
- カラー文書画像中の文字領域抽出を目的とした色分割についての検討
- カラー画像中の文字列抽出
- 固有値を二重に補正した共分散行列を用いた2次識別関数
- 固有値の偏り補正に基づく2次識別関数 (パターン認識のための学習 : 基礎と応用)
- 新しいロバストな2次識別関数
- 多次元で有効な新しい2次識別関数
- カラー文書画像中の文字領域抽出のための領域分割方式
- こう配法によるオプティカルフローの誤差評価
- OCR入力文書形態のロバストな判定方法
- カラー画像中の文字列抽出法 (「色知覚と色彩メディア処理(3))
- 目次ページの判別と領域分割
- 汎用を目指した文書画像認識システム : 領域分割処理の改良
- 統計的手法による文書画像中の領域解釈
- ライフゲームの挙動におけるセル数依存性
- 文書画像中の点線抽出アルゴリズムの検討
- 汎用を目指した自動文書画像認識システム : 要素抽出技術の問題点と検討
- ライフゲームにおける過渡現象のセル数依存性
- 顔平面を用いた顔表情解析
- 顔部品に依存しない正面顔を用いた表情認識手法(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- I-068 表情差分マップを用いた表情認識(I.画像認識・メディア理解)
- 顔平面を用いた顔表情解析 (第20回センシングフォーラム 資料--センシング技術の新たな展開と融合) -- (セッション1C2 人物と顔のパターン計測(2)--パターン計測部会企画)
- 6-106 産学連携による長期インターンシップの教育的効果 : 福井大学工学研究科における産学連携による実践型人材育成事業(口頭発表論文,(20)産学連携教育-I)
- 面の法線方向を考慮した回転ミラーヘッド顕微鏡像群からの3次元形状復元の一手法
- プリント配線板刻印文字の認識
- ライフゲームにおける過渡現象のセル数依存性
- 面の法線方向を考慮した回転ミラーヘッド顕微鏡像群からの3次元形状復元の一手法 (パターン認識・メディア理解)
- 3次元運動パラメータ推定のためのホモグラフィ分解による解の曖昧性について(一般セッション,一般物体認識・画像特徴量)
- 2.5D部分顔画像からの顔表情認識(一般セッション19)
- 多視点映像の切替え提示による注目対象誘導のための視点間画像補間による滑らかな視点切替えの一手法(テーマ関連セッション6)
- 2.5D部分顔画像からの顔表情認識(一般セッション6,三次元画像,多視点画像)
- 多視点映像の切替え提示による注目対象誘導のための視点間画像補間による滑らかな視点切替えの一手法(テーマ関連セッション6,三次元画像,多視点画像)
- 2.5D部分顔画像からの顔表情認識(一般セッション6,三次元画像,多視点画像)
- 顔部品に依存しない正面顔を用いた表情認識手法(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- K-013 顔表面からの法線を用いた顔表情認識(K.ヒューマンコミュニケーション&インタラクション)
- I-002 画面構成の連続性による多視点映像の切替え提示における注目対象誘導(I.画像認識・メディア理解)
- 視覚障害者のためのフライングディスク競技支援システムの開発
- ホモグラフィ行列分解による唯一解に関する考察(一般セッション,Computational Photography)
- カラー文書画像処理
- カラー文書画像処理
- 段階的弛緩法による文字列抽出
- オプティカルフロー法による移動物体を含んだ画像からの奥行き情報の推定
- 1画素マッチング処理とベクトルメディアンフィルタを用いた高精度オプティカルフローの効率的推定
- 時空間画像の濃度こう配を利用した1画素マッチングによるオプティカルフローの抽出
- 視覚障害者用文書画像認識システム
- 文書理解処理のための前処理について
- オブジェクト指向と状態遷移モデルに基づくシーケンス制御用言語のグラフィックエディタ
- 図書目録カードの認識・理解システム(II)
- 図書目録カードの認識・理解システム(I)
- 和漢書用図書カード認識システム
- ステレオPAL画像による距離測定とその精度について
- 地域IXによる安定した地域内通信環境の実現と評価(次世代のインターネット/分散システムの構築・運用技術)
- 広域分散コンテンツサーバシステムの構築
- LAN環境におけるコンテンツサーバの設計と性能評価
- 地域IX構築及びアプリケーションインフラ技術の研究
- 国内における地域IXの技術動向
- 封じ込め磁界を利用したトロイダルプラズマ式マグネトロンスパッタ法の開発
- パラメトリック固有空間法による回転文字の認識
- (292)学生に分かり易い授業をするための工夫について(セッション84 ファカルティ・デベロップメントIII)
- (83)MATHEMATICAを組み込んだWEB-CAIシステムの設計(セッション24 e-ラーニング(インターネット・マルチメディア利用教育を含む)IV)
- パラメトリック固有空間法による回転文字の認識
- 道路案内標識中の矢印と文字領域の対応付けに関する実験的検討
- カラー文書画像処理
- Mathematicaを組み込んだ理工系対応CAIシステムの試作
- ステレオPAL画像からの3次元再構成
- Designing a Web-CAI System Incorporated with MATHEMATICA(Educational Technology)
- 色範囲を規定しない青色案内標識抽出の検討
- On the Precision of 3D Measurement by Stereo PAL Images
- 地域産業と連携した長期インターンシップ
- 図書カード理解システムのGUIの設計
- 手書き文字の変動評価 : 小学生を対象として
- HMMに基づく交通監視映像の背景・物体・影の分離手法
- スペクトル解析による1次元セルオートマトンの分類
- シーケンス制御用プログラムの統合化開発環境の試作
- 散逸境界条件下のセルオートマトンについて
- 多カテゴリー認識問題の理論的考察 : 期待正解率の効率的計算式の導出
- スペクトル解析による1次セルオートマンの分類
- 日照条件に依存しない移動物体の検出
- 多カテゴリ認識問題における正解率の評価 : 教育パターンの効果
- ゲートを通過する物体の種類判別と計数
- 視覚障害者も利用可能なグラフィックインターフェイスの検討
- オブジェクト指向に基づくシーケンス制御用言語のコンパイラの作成
- 階層型ニューラルネットとベクトル量子化法を用いた文字認識実験
- 文字認識における特徴空間分割に関する一考察
- オブジェクト指向を用いたシーケンス制御用言語及びプログラミング支援システム
- 認識・検出 ボケ図形の見方・考え方 : ボケ量の数量化とその応用
- 六方非対称な雪の結晶の類似パターン生成(研究速報)
- ニューラルネットを利用した文字認識実験の一検討
- オブジェクト指向によるシーケンス制御のモデル化
- 六方非対称な雪の結晶の類似パターン生成