OCRの認識誤り訂正における学習の効果
スポンサーリンク
概要
- 論文の詳細を見る
日本語OCRでは、十分な認識正解率が得られず、OCR認識結果を自動訂正する装置が考えられてきた。筆者らも、自動訂正する手法として、認識誤り(コンフュージョン)マトリクスや、形態素解析を組み合わせる方法を提案してきた。筆者らの提案する手法では、人出による訂正履歴や、文字パターンをページ単位で学習することで、OCRの持つ認識誤りの癖を吸収し、一連のテキストでは繰り返し同じ修正をユーザに行なわせないという効果が期待できる。本稿では、提案する手法における学習の効果を検証するため、試作したシステムにおいて、学習を行なわない場合の認識正解率と、学習を行なった場合の正解率の差を報告する。
- 一般社団法人情報処理学会の論文
- 1993-03-01
著者
-
村木 一至
Nec Corp.
-
浜田 和彦
Nec情報システムズ
-
森 義和
(株) 日本電子化辞書研究所
-
村木 一至
(株)日本電子化辞書研究所
-
浜田 和彦
NEC技術情報システム開発
-
村木 一至
Nec C&cメディア研究所
関連論文
- 英日翻訳システムを基にした多言語翻訳システムの構築
- MIIDAS : 情報の選別とEasy Readingのためのエピソード
- MIIDAS:情報の適合的選別による文書フィルタリング
- MIIDAS : 情報の選別的共有のためのオントロジ構築とその増進的学習
- 5W1H分類・ナビゲーションによる情報活用プラットフォーム
- 大規模データのセルフナビゲーショナルアクセス : SPIRAL Method
- FEP型英文作成支援ツールにおける対訳例文利用機構
- FEP型英文作成支援ツール : 外国語情報発信の効果的インタフェース
- FEP型英文作成支援ツール : 日英構文変換部
- FEP型英文作成支援ツール : 訳語選択のユーザインタフェースと辞書記述
- 新聞記事からの情報抽出と多言語インデックス付与
- キーワードと構文構造に基づくテキストからの情報抽出システム
- キーワードと構文構造に基づく情報抽出システムにおける文脈処理
- 辞書中の語義例文に基づく事例ベース動詞意味選択
- 辞書に事例を付記することによる訳語選択・意味選択機能の強化
- 電子化辞書管理のための自然言語インターフェース : 質問文コーパスの機能分類
- 商用機械翻訳ユーザ辞書の共通フォーマット設定に向けて (第54回全国大会 (平成9年前期 於 : 千葉工大) 大会優秀賞受賞論文 (11件)
- 機械翻訳ユーザ辞書データ流通のための共通フォーマット : アジア太平洋機械翻訳協会の活動報告
- 商用機械翻訳ユーザ辞書の共通フォーマット設定に向けて
- 日本語文章からの文章骨格の抽出
- 文章執筆推敲支援システムIdeaPの概要
- 大規模電子化辞書DB管理プログラム作成のための自然言語インタフェース
- 電子化辞書管理のための自然言語インタフェースシステム : システム概要とその構成
- 電子化辞書管理のための自然言語インターフェース : システム依存構造の生成
- OCRの認識誤り訂正における学習の効果
- 機械翻訳ユーザ辞書データ流通・相互利用のための共通フォーマット設定活動 : アジア太平洋機械翻訳協会の活動報告
- 程度表現の意味モデル
- 意味表現における関係概念の扱い
- 翻訳機能付きワープロ : 不安と疲れを感じさせないインタフェース
- PIVOT : ソフトウェアの構成と機能
- 概念説明文の文体と翻訳時の同義性確保の指針
- 複数言語で記述した概念説明文の開発手法
- 機械翻訳システムPIVOTにおける格パターンの処理
- 機械翻訳システムPIVOTの日本語格フレームモデル
- 機械翻訳システムPIVOTにおける格パターン選択について
- 動詞語義例文と概念辞書を用いた動詞意味選択
- 日本語による辞書管理プログラム作成の支援
- テレビニュース番組電子化原稿を題材とした自動要約手法の大規模評価
- アイデアインテグレーション環境
- Augmented Dependency Grammar(ADG)の意味構造(II)