手書き住所読取りのための町名検索アルゴリズム : 文字タグ法
スポンサーリンク
概要
- 論文の詳細を見る
郵便物の宛名住所のようにフリーピッチで書かれた手書き文字列は、字形が多様で、文字サイズにばらつきがあり、文字の接触・入組みなどもよく起きる。したがって、その読取りでは、誤切出し/誤認識によって欠落した正解文字を補完可能な知識処理が不可欠である。現在主流となっている知識処理の枠組みは、まず、各文字位置(セグメント)に複数通りの可能性(候補文字)を許した認識結果文字列と単語辞書とを照合し、さらに、単語の並びとしての妥当性を判定して読取り結果を決定する2段構成である。正解文字の欠落には、1段目の単語照合で虫食い照合を行うことで対処する。しかし、このような従来の枠組みは、フリーピッチ手書き文字列の読取りを正確かつ効率よく行うのに、まだ十分なものとは言えない。第一に、例えば「川崎市宮前区」の「市宮」が接触して1セグメントとされてしまったときなど、単語の境界位置を確定できないようなケースがうまく扱えない。第二に、2段目の単語列探索で最良解が保証されるように、1段目の虫食い照合で正解文字欠落のあらゆる可能性を求めておこうとすると、最悪の場合、単語辞書の全探索あるいは候補文字の組合せ爆発が起きる。そうでなければ、虫食い照合に1文字不一致のみのような制限を付けて、可能性を切り捨てることになる。1段目の単語照合に限ってみれば、各文字位置から単語へのインデックスをもつ松本らの手法が効率よい虫食い照合を可能にしているが、そのままではフリーピッチの単語列読取りには適用できない。本稿では、上記のような問題を解決するたの、従来の2段構成とはまったく異なる知識処理の枠組みとして、「文字タグ法」と名付けた新しいアルゴリズムを提案する。手書き宛名住所から都道府県名・市区郡名・町名の並びを読み取る応用を例に概要を紹介する。
- 一般社団法人情報処理学会の論文
- 1995-03-15
著者
-
下村 秀樹
Nec情報メディア研究所
-
下村 秀樹
日本電気株式会社ヒューマンメディア研究所
-
下村 秀樹
Necヒューマンメディア研究所
-
福島 俊一
NECインターネットシステム研究所
-
福島 俊一
日本電気株式会社ヒューマンメディア研究所
-
福島 俊一
Nec
-
森 義和
株式会社NEC情報システムズ
-
森 義和
NEC情報システムズ
-
森 義和
(株)nec情報システムズ
関連論文
- 組み込み向けマルチコアSoCにおける周期的プロセッサ間通信手法の提案(ARC-7:マルチコア2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 5A-3 データ生存期間の規則性を活かした高速高効率メモリ管理手法(組込みと効率化,一般セッション,アーキテクチャ)
- 転置インデクスに適用可能な高速文字列あいまい照合アルゴリズム
- 仮説検証型認識知識処理における処理速度と精度の評価実験
- 冗長情報を利用した手書き住所読み取り知識処理の一評価
- 強い単語並び制約による手書き文字列認識知識処理の評価
- 要素単語の相互チェックに基づく手書き文字列認識知識処理
- 手書き住所読取りにおける街区住所知識処理方式
- 意見抽出を目的とした機械学習による属性-評価値対同定(属性抽出)
- 仮説生成と検証の効率的組合せに基づく手書き文字列読み取り向け知識処理方式
- 転置ファイルとビット配列を用いた高速文字列あいまい照合アルゴリズム
- 認識知識処理 (認識と制御技術 特集)
- ボトムアップ/トップダウン処理を融合した手書き文字列読み取り知識処理
- 手書き文字列読み取りのための単語列探索アルゴリズム : 文字タグ法
- 手書き文字列読み取りのための単語連鎖制約に基づく効率的探索と棄却
- 効率的探索とトップダウン的検証を組み合わせた手書き住所読み取り知識処理
- 文字タグ法による手書き住所読み取りの評価
- A-4 テキストからの類義語抽出手法とその評価(概念と言語(I))
- 手書き文字列読み取りのための単語列探索アルゴリズム : 文字タグ法
- 手書き住所読取りのための町名検索アルゴリズム : 文字タグ法
- 手書き住所読取りにおけるパタン処理と連携した住所知識処理方式
- 共起類似性に基づく同義語の抽出
- 仮名漢字変換における最近使用語優先学習方式のモデル化
- 仮名漢字変換の変換手法と学習に関する一評価
- 仮名漢字変換における変換手法と変換精度についての比較実験
- 仮名漢字変換における最近使用語優先学習方式の解析と評価
- 仮名漢字変換システムにおける単語自動登録の一方式
- 日本語DTPのための基本描画システムの作成
- 文書フォーマッタ"浄書"のレイアウタ
- 人間の文章誤り検出能力と誤り検出機能の効果に関する実験
- 言語Cコンパイラのマルチバイト化の実現方式
- 最小コストパス探索モデルの形態素解析に基づく日本文誤り検出の一方式
- 言語Cとのインターフェイスを持つScheme処理系
- 文書フォーマッタ"浄書"第4版の設計
- 字面処理による日本文誤り検出の一方式
- 科学技術論文のためのグラフ作成ツールの設計と実現
- 仮名漢字変換における最尤候補選択アルゴリズムの実験
- 浄書システム第3版の方式設計
- OS/omicronにおける日本語文書作成支援環境の構築を目的とした文章エディタの設計
- 日本語ワードプロセッサにおける仮名漢字変換の変換処理の探針テスト
- OS/omicron仮名漢字変換システム第2版の設計と実現
- OS/omicron仮名漢字変換システム第2版の設計思想
- D-2 Support Vector Machineを用いた地域情報ページの自動分類(Webコンテンツ処理,D.データベース)
- モバイルサーチエンジンWithAirの試作と評価
- モバイルサーチエンジンWithAirの試作と評価
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 情報検索システム評価用データベースの構築の提案
- 意見抽出のための評価表現の収集
- インターネットからの評判情報検索(WWW上の情報の知的アクセスのためのテキスト処理)
- テキストマイニングによる評価現象の収集
- D-1 意見分析システムにおける意見抽出方式の検討と評価(Webコンテンツ処理,D.データベース)
- インターネットからの評判情報検索
- インターネットからの評判情報検索
- 大規模テキスト並列検索エンジンRetrievalExpress (1) : 並列検索方式
- 全文検索用文字成分表の一圧縮方式
- 文章解析アクセラレータ(2) : 接続検定マシンMONCの試作と評価
- 形態素抽出マシンMEX-IIの試作と評価
- 形態素抽出マシンMEX-IIの概要
- ア***ロセッサによる文脈自由言語の並列認識アルゴリズム
- 文章解析アクセラレータ(1) : 形態素抽出マシンの試作
- 多重照合型形態素抽出方式に関する検討
- 文字列検索LSIを用いた国語辞書システムの構築法
- 文構造を有する日本語テキストエディタJESS
- 日本語文章作成支援システムCOMET
- 辞書およびパターンマッチルールの増強と品質強化に基づく日本語固有表現抽出
- 予測ペン入力インタフェースとその手書き操作削減効果
- 大語彙かな漢字変換 : 未登録語と区切り誤りの減少
- 招待講演:新世代検索ポータル技術 (2001年情報学シンポジウム講演論文集--21世紀の情報化社会・ネットビジネスを支える情報学/情報技術) -- (セッション5:情報技術の視点から)
- 「情報検索の新たな展開 : テストコレクションからサーチエンジンまで」
- WWWサーチエンジン (特集 情報検索)
- Webサーチエンジンの基本技術と最新動向(上)基本技術
- Webサーチエンジンの基本技術と最新動向(下)最新技術
- WWW情報検索技術と評価の問題(情報検索システムの力くらべ : テストコレクションによる評価)
- 農業情報の検索・ナビゲーション (特集 情報化がもたらす新しい農業・農村)
- 専用ハードウェアを用いた形態素解析器の開発
- 検索エンジンの仕組みと技術の発展(インターネット検索エンジン)
- モバイルユーザ向け情報選別配信技術
- 目的および個人に特化したサーチエンジンの開発 (「Webシステムにおける情報獲得支援技術」)
- 4P-9 組合せ情報フィルタ方式の信頼度を用いた精度改良
- 単語の概念を採り入れた日本文チェックの一方式
- OS/omicron仮名漢字変換システムとユーザ辞書
- ハードリアルタイム処理向けマルチコアタスク配置の評価関数設計 (ディペンダブルコンピューティング)
- ハードリアルタイム処理向けマルチコアタスク配置の評価関数設計 (コンピュータシステム)
- ハードリアルタイム処理向けマルチコアタスク配置の評価関数設計
- ハードリアルタイム処理向けマルチコアタスク配置の評価関数設計
- 大語彙辞書を用いたかな漢字変換についての考察