日本語文書リーダ後処理の実現と評価
スポンサーリンク
概要
- 論文の詳細を見る
日本語文書リーダは,世の中で流通している雑誌,書籍,公文書等の印刷文書を読み取り,計算機で使用されているコード情報に変換する装置である.文書リーダ後処理は,文書リーダ装置の文字認識部で認識した結果の候補文字集合列に対して,単語照合,文法検査などの言語処理を施し,正解文字列の推定を行う.推定方式としては,(1)文字認識から得られる各候補文字に付けられた評価値,および,(2)単語照合検査,単語間接続可能性検査や文字接続確率などの言語的制約によって計算される評価値,の2つに基づく方式を考案し実現した.その結果,後処理前認識率,すなわち文字認識のみの認識率が90%以上の場合,後処理を施すことにより,認識率をほぼ95%以上に高めることが可能になった.本論文では,後処理における諸問題とその解決策,本システムの処理方式と今後の課題について述べる.
- 一般社団法人情報処理学会の論文
- 1989-11-15
著者
-
西野 文人
富士通研
-
西野 文人
富士通研究開発中心
-
西野 文人
(株)富士通研究所ソフトウェア&ソリューション研究所
-
西野 文人
(株)富士通研究所 コンピュータシステム研究所 ドキュメント処理研究部
-
高尾 哲康
(株)富士通研究所川崎研究所ソフトウェア研究部
-
西野 文人
(株)富士通研究所川崎研究所ソフトウェア研究部
-
高尾 哲康
(株)富士通研究所
関連論文
- Webアノテーション技術を用いたコンテクストによる情報整理方式の提案(セッション情報の構造化/整理)
- ソーシャルな情報再構成による情報共有システムの提案
- スケジュール情報からのインフォーマルコミュニティ抽出(セッション1: コミュニティー支援・コミュニケーション支援)
- スケジュール情報からのインフォーマルコミュニティ抽出(セッション1: コミュニティー支援・コミュニケーション支援)
- トップダウンなパターン解析に基づく情報抽出
- 文書中の情報を整理する情報抽出技術 (特集 電子図書館を支える技術)
- 検索ログからの話題抽出に向けて : サイト種別の自動判定の試み (情報処理学会 情報学基礎研究会(FI) 第69回 発表論文)
- 検索ログからの話題抽出に向けて : サイト種別の自動判定の試み
- FACOM 6365文書読取装置
- テキスト分類のためのカテゴリ割り付け戦略
- 5. 文字認識における自然言語処理 ( 自然言語処理技術の応用)
- 知識資産活用のための情報抽出 (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- 新聞記事からの用語集作成のためのテキスト分析
- 新聞記事からの人物・企業情報の抽出
- 新聞記事からの人物・企業情報の抽出
- 文書検索による概況調査支援システム (特集 Webコンピューティング) -- (ミドルウェアとコアテクノロジ)
- 2P-4 専門用語集を検索インタフェースとする文書群アクセス
- 日本語テキスト分類における特徴素抽出
- 擬似文字認識による文字認識後処理実験環境
- 英語形態素解析用辞書のコンパクト化
- 英語形態素解析Emorにおける品詞推定
- 未登録語テンプレートを用いた日本語形態素解析
- インスタントコミュニティ生成支援に関する一考察(オフィスインフォメーションシステム、Webシステム及び一般)
- 日本語文書リーダ後処理の実現と評価
- 日本語文書リーダ後処理における未登録語処理
- カスタマーセンター支援システム
- 交換ソフト向け詳細設計支援システムPDAS
- Linked Dataの企業での活用について
- 86-20 ケストレル研究所における知識ベースに基づくソフトウェア開発環境に関する研究
- 84-25 PECAN: マルチビューを利用できるプログラム開発システム
- Linked Data : つながるデータ,広がるサービス
- 知識の横断検索I-Scover