オンライン文字認識における後処理 : 住所・姓名の文字補完機能
スポンサーリンク
概要
- 論文の詳細を見る
オンライン文字認識における後処理では、辞書との照合により認識率の向上をはかるだけではなく、一部の入力から単語を予測する文字補完機能が求められる。著者らはアプリケーション上重要な漢字住所とカナ姓名について文字補完機能を実現した。その手法の有効性を確かめるため、日本全国の住所(漢字)および日本人の姓名(カナ)についてそこに含まれる情報量を考察した。実験の結果住所の場合では1文字が得られるだけで、予測単語数の基待値は平均1-2程度(最高16)であり、カナ姓名についてもどの値の値は5はら10程度に収まることがわかった。
- 社団法人電子情報通信学会の論文
- 1994-10-20
著者
-
伊東 伸泰
日本アイ・ビー・エム東京基礎研究所
-
加藤 真
日本アイ・ビー・エム(株)東京基礎研究所
-
伊東 伸泰
日本IBM株式会社東京基礎研究所
-
野崎 広志
日本アイ・ビー・エム(株)東京基礎研究所
-
伊東 伸泰
日本ibm東京基礎研究所
-
野崎 広志
日本アイ・ビー・エム 大和研究所
-
野崎 広志
日本IBM東京基礎研究所
-
加藤 真
日本IBM東京基礎研究所
関連論文
- 剖検記録の音声認識のための言語モデル作成
- 単語クラスタリングによる確率的言語モデルの分野適応
- 電話音声による列車時刻問合せシステムの評価
- LSAにもとづく電話音声情報検索システム
- 子供音声データベース
- 構造を仮定しない文解釈の一手法
- 自由発話向け言語モデルの現状と課題
- 講義コーパスを用いた自由発話の大語彙連続音声認識(音声情報処理 : 現状と将来技術論文特集)
- 形態素係り受けモデルによる構文解析
- 2000-SLP-32-3 構文構造を反映した確率的言語モデル
- 放送大学コーパスを用いた自由発話の大語彙連続音声認識
- 口語体言語モデルのためのコーパス
- 単語を認識単位とした日本語の大語彙連続音声認識 (音声言語情報処理)
- 音声ワープロ : 過去・現在・未来
- 放送音声の書き起こしに関する検討
- 音声認識・合成によるホームページの閲覧方式
- 単語単位による日本語言語モデルの検討
- ニュース音声書き起こしシステムに関する検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 電話音声による列車時刻問合せシステムの評価
- 日本語自由発話電話音声からの固有表現抽出
- 音声とテキストを用いた認識単語辞書の自動構築
- 階層的パターンマッチングにおける簡易高速識別方法
- 同音語誤りリストからのかな漢字変換辞書作成
- かな漢字変換から拡張・一殿化した日本語処理プラットホームの提案
- テキスト・ベースかな漢字変換
- かな漢字変換と漢字かな変換を共に用いる同音語誤りの検出方式
- タグなしコーパスによる形態素解析と仮名漢字変換の精度向上
- タグなしコーパスによる形態素解析と仮名漢字変換の精度向上
- オンライン文字認識における後処理 : 住所・姓名の文字補完機能
- カナ姓名のペン入力後処理における予測処理について
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- オンライン文字認識における文字検証の一手法
- ニューラルネットワークを用いたオンライン手書き文字認識
- 単語を認識単位とした日本語ディクテーションシステム
- 口述筆記や音声対話,音声自動翻訳に実用化されはじめた 声認識技術の基礎と応用プログラム開発手法 (特集 マルチメディア/インタ-ネット時代の必須技術となる 圧縮/認識/合成を追求する音声処理の徹底研究)
- 音声認識の最新技術--日本語ディクテ-ションプログラム
- N-gramを用いた日本語テキストの単語単位への分割
- クラスに基づく言語モデルのための単語クラスタリング
- 離散単語発生による日本語ディクテーションシステムについて
- 確率文法を用いた文書論理構造の解釈法
- 文書の論理構造を解釈する一手法
- 正規表現を辞書項目とする形態素解析辞書の構成と利用
- オンライン文字認識を用いた漢字住所入力
- Bigramによるオンライン漢字認識の文脈後処理手法
- OCR入力された日本話文の誤り検出と自動訂正
- 認識文字候補からの高速予備選択法
- 日本語Dictation Systemのための統計的言語モデルに関する一考察
- D-12-38 事前印刷文字上に記入された記号の認識に関する検討