二値化閾値の補正と罫線形状判定による罫線抽出の高精度化(テーマセッション1,文字・文書の認識・理解)
スポンサーリンク
概要
- 論文の詳細を見る
帳票画像から様々な種類の罫線を高精度に抽出する方式について述べる。近年の帳票OCRは、デジタルカメラの普及などに伴う帳票画像の多様化に対応するため、様々な帳票書式や画質に対しても高い帳票認識精度が求められている。我々は既に複雑な表構造に対応したセル抽出方式や、テクスチャ境界を含む帳票画像からの罫線抽出方式を開発してきたが、ノイズの重畳や画質劣化に対してもロバストな精度を実現するためには更なる改善が必要である。表認識誤りの大半を占める罫線抽出誤りは脱落誤りと付加誤りとに分類できるが、今回、それぞれの主な原因である罫線途切れと文字列からの罫線誤抽出を改善する技術を開発した。本稿では、先ず抽出したい罫線の条件を定義し、その条件を満たす罫線を抽出するために我々が採用したアプローチについて説明する。続いて罫線途切れを解消するための二値化閾値の補正について述べる。次に、先に定義した抽出罫線の条件を用いて罫線の形状を判定し、付加誤りを抑制する方法について述べる。最後にサンプル帳票画像を用いた評価を行い、本方式の効果と課題について考察する。
- 社団法人電子情報通信学会の論文
- 2008-02-14
著者
-
武部 浩明
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
-
藤本 克仁
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
-
田中 宏
(株)富士通研究所
-
藤本 克仁
株式会社富士通研究所
-
田中 宏
東邦大学医療センター佐倉病院外科
-
藤本 克仁
富士通研究所
-
藤本 克仁
(株)富士通研究所
-
藤井 勇作
(株)富士通研究所
-
武部 浩明
株式会社富士通研究所
-
武部 浩明
(株)富士通研究所
関連論文
- テロップ文字パターン抽出の一検討(テーマセッション6,文字・文書の認識・理解)
- 文字認識技術を利用した講義動画のスライド同定--文字配置の類似度によるスライド同定方式と講義動画のスライド同定作業コストの削減効果
- ペンインタフェースのための手書き文字認識技術
- 低解像度テキスト画像の高速かつ高精度な2値化方式
- D-11-108 プレプリント接触数字認識の一方式
- 文書間の色一様性に基づく文書画像群からの機密パターン抽出(ソフトコンピューティング及び一般)
- 独立成分分析の分光画像処理への適用
- 二値化閾値の補正と罫線形状判定による罫線抽出の高精度化(テーマセッション1,文字・文書の認識・理解)
- 平行測地線からの形状復元によるデジカメ文書画像の歪み補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
- D-12-146 認識誤りに対応した単語抽出方式(D-12.パターン認識・メディア理解,一般講演)
- D-12-142 参照画像の動的合成に基づく罫線接触文字の一括認識(D-12.パターン認識・メディア理解,一般講演)
- D-12-141 文字ペア特有の識別情報を使用した類似文字認識に関する一検討(D-12.パターン認識・メディア理解,一般講演)
- D-12-30 消失点検出にハイブリッド手法を用いた携帯デジカメ撮影画像のための透視歪み補正(D-12.パターン認識・メディア理解,一般講演)
- e-文書・内部統制向け文書画像認識技術 (特集 研究開発最前線)
- 確率伝搬法を用いた帳票の論理構造認識に関する一方式
- D-12-88 文字列抽出用/図表抽出用の2種類の2値化方式を使用したカラー文書画像レイアウト解析手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-86 混色と薄い色使いにも強いカラー帳票レイアウト復元手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-65 複数の処理結果統合によるテキストブロック抽出手法(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-42 仮説検証に基づく再帰的テキストブロック抽出手法(D-12.パターン認識・メディア理解A)
- D-11-94 平行測地線からの形状復元による画像歪み補正についての一検討(D-11.画像工学D)
- D-12-80 デジタルカメラと電子ペンを用いた紙情報入力についての一検討
- ディジタルカメラ画像からの罫線抽出の一方式
- D-12-19 非接触入力による濃淡画像からの罫線抽出方式
- 低解像度カラー文書画像から高品質な文字画像を抽出する二値化方式
- 文字認識技術を利用した講義動画のスライド同定(画像・映像処理)
- D-11-65 信頼性の高い文字要素を利用した帳票画像からの行抽出処理(D-11. 画像工学,一般セッション)
- 形態素解析とキーワード領域内の候補文字ラティス情報を用いた単語照合による文書画像の高精度検索方式(画像検索, 画像の認識・理解論文)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援 : 動画とスライドの対応付けとポインティング情報抽出(INFOSTAシンポジウム2003一般発表)(INFOSTAシンポジウム2003)
- 文字と画像のマッチチングを用いた講義動画中のスライド同定
- D-12-69 講義動画中のスライド同定を利用したレーザーポインタの同期表示
- スキャナで取得した画像におけるポストプリント・パターンのインク色と背景色との混色及びその補正に関する一考察(テーマセッション,文字・文書の認識・理解)
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- A-7-12 EMF形式印刷データへの文字認識処理による機密文書の検出(A-7.情報セキュリティ,一般セッション)
- D-12-50 マークパターンが重畳された文字に対する認識方式(D-12.パターン認識・メディア理解,一般セッション)
- 文字特徴からの特徴合成に基づく単語一括認識(画像認識, コンピュータビジョン)
- 文字特徴からの特徴合成に基づく動的単語一括認識
- 文字特徴からの特徴合成に基づく単語一括認識
- D-12-17 連続DPを用いた英数接触活字の切り出しと認識
- テクスチャ領域を含む帳票画像からの罫線抽出(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- タブレットを利用した手書き電子メモからの情報入力
- I-003 タブレットを利用した自由手書きメモからの情報入力 : 電話対応システムへの応用(I.画像認識・メディア理解)
- ペン入力手書き文字認識Active-X部品 (特集2:プリント基板)
- 2L-2 ハイブリッド型ペン入力手書き文字認識における認識対象のUnicode拡張
- オンライン認識とオフライン認識の候補統合によるハイブリッド型ペン入力文字認識エンジン
- オンライン認識とオフライン認識の候補統合によるハイブリッド型手書き文字認識
- 手書き入力による文字検索機構の開発(OAKV5.0)
- 階層遅延セグメンテーションを用いた実時間枠なしオンライン手書き文字列認識
- 階層遅延セグメンテーションを用いた実時間枠なしオンライン手書き文字列認識
- 階層遅延セグメンテーションを用いた実時間枠なしオンライン手書き文字列認識
- グラフ表現を利用した手書き数字列のセグメンテーション方式(テーマセッション7,文字・文書の認識・理解)
- 文字仮説の多重生成による帳票画像からの単語抽出方式(テーマセッション1,文字・文書の認識・理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- D-12-64 形態素と候補文字情報を用いた文書画像の高精度検索方式
- D-12-14 特徴ベクトルの差分分布の利用に基づくフォントフリー文字認識手法
- 特徴領域の射影推定による高速高精度な大分類方式
- 図書の電子化のための文書認識技術 (特集 電子図書館を支える技術)
- 圧縮文字特徴と原特徴を併用した高速かつ高精度な文書認識方式
- オンライン手書き文字認識のためのテンプレートキャッシングによる筆者適応手法
- HCI International 2001 参加報告
- HCI International 2001 参加報告
- 公開インクフォーマットの設計と手書き電子メール環境の開発
- 手書き電子メール環境の応用利用
- 正読確立を用いた高速高精度な文字認識方式
- 機密文書の漏えい対策に向けた社外秘マークや透かし文字の検出技術
- 交点追跡と全体最適化に基づく罫線抽出誤りに頑強な表項目セル抽出
- LI-5 文字認識を利用した講義動画中のスライド同定(I. 画像認識・メディア理解)
- D-12-20 カラー文書のモアレモデルを用いた高速文字パターン抽出法
- 背景模様付き見出しからの文字列抽出 : 連結成分の組合せの認識評価による抽出
- ビジネス文書を対象としたキ-ワ-ド自動抽出技術
- 未知文書とモデル文書の基準罫線対を適応的に用いる高精度高速フォーム識別方式
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援--動画とスライドの対応付けとポインティング情報抽出 (INFOSTAシンポジウム2003--情報サービスソリューションに向けて)
- 文字認識と画像マッチングを利用した講義動画のスライド同定
- 交点追跡と全体最適化に基づく罫線抽出誤りに頑強な表項目セル抽出(画像認識,コンピュータビジョン)
- 二値化閾値の補正による低解像度画像に頑強な文字抽出用二値化(テーマセッション,文字・文書の認識と理解)
- 手書き電子メール環境の予備評価
- 2分割したA3紙のスキャン画像からの画像復元技術の一検討
- 2分割したA3紙のスキャン画像からの画像復元技術の一検討
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- PS-077-1 炎症性腸疾患手術80例の検討(PS-077 炎症性腸疾患,ポスターセッション,第112回日本外科学会定期学術集会)
- SF-002-3 2系統造影MD-CTによるクローン病の術前3D病変評価による術式決定と術後Infliximab管理による再発予防療法の成績(SF-002 サージカルフォーラム(2)炎症性腸疾患,第112回日本外科学会定期学術集会)
- PS-138-5 当院における癒着性腸閉塞に対する腹腔鏡下手術の成績(PS-138 大腸 低侵襲,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-173-1 当院での成人鼠径ヘルニア269例297側の手術成績(PS-173 腹壁・ヘルニア 臨床-2,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-161-4 乳癌の個別化治療 : intrinsic subtype別の乳癌術後治療戦略(PS-161 乳腺 化学療法-3,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-112-8 縦隔腫瘍に対する胸腔鏡下手術の有用性の検討(PS-112 肺 外科治療(良性),ポスターセッション,第112回日本外科学会定期学術集会)
- PS-112-2 当院で施行された気胸に対する胸腔鏡手術の検討(PS-112 肺 外科治療(良性),ポスターセッション,第112回日本外科学会定期学術集会)
- PS-087-3 当院でのLACの標準化のための教育システム(PS-087 消化管 鏡視下,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-017-1 腹腔鏡下低位前方切除術における手術手技の工夫(PS-017 消化管 手術手技,ポスターセッション,第112回日本外科学会定期学術集会)
- 対象知識を利用した文書画像の2値化(画像認識,コンピュータビジョン)
- PS-133-3 乳癌術後のintrinsic subtypeによる個別化治療(PS ポスターセッション,第113回日本外科学会定期学術集会)
- PS-020-5 高齢者の肺気腫に合併した気胸に対する胸腔鏡手術の検討(PS ポスターセッション,第113回日本外科学会定期学術集会)
- PS-151-1 重症筋無力症の手術適応と予後の検討(PS ポスターセッション,第113回日本外科学会定期学術集会)
- PS-332-1 当院での虫垂切除術例の検討(PS ポスターセッション,第113回日本外科学会定期学術集会)
- デジタルペンを活用したグループワーク電子化支援システム