スキップマルコフ連鎖モデルを用いた日本文の誤り検出、訂正方法
スポンサーリンク
概要
- 論文の詳細を見る
OCRや音声認識装置等から入力された文に含まれる誤りを自動的に検出する方法の一つとして、誤り箇所におけるマルコフ連鎖モデルの文字連鎖確率が連続して減少し、その減少回数が、誤り種別と誤り文字数に依存することに着目した方法が提案されている[6]。この方法には、(1)脱落誤りの検出精度が置換または挿入誤りなどと比べて低いこと、(2)置換、挿入および脱落の誤りが組み合わさった混合誤りを正しく検出・訂正できないこと等の問題がある。本論文では、その解決法として、離散的な文字の結合力をみるスキップタイプのマルコフ連鎖モデルを用いる方法を提案した。また、この方法を日本語新聞記事(擬似的に発生させた標本文3, 400件の誤り)を用いて、検出と訂正の実験を行い、従来の方法と比較評価した。その結果、脱落誤りについては、検出精度が(再現率と適合率の調和平均で)14%程度向上し、その検出精度は90%程度となった。また、混合誤りについては、「置換1文字+脱落1文字誤り」で検出精度が93.4%、訂正精度が61.1%、「置換1文字+挿入1文字誤り」で検出精度が90.4%、訂正精度が83.3%であることがわかった。
- 社団法人電子情報通信学会の論文
- 2000-03-17
著者
関連論文
- 2重, 3重のマルコフ連鎖モデルを2段階に使用したべた書き仮名文の文節境界推定法
- 音節連鎖特性に着目した対話文の言い直し表現の抽出法
- 音節連鎖特性に着目した対話文の言い直し表現の抽出法
- マルコフモデルによる言い直し対象の文字列の検出について
- 読みの情報を用いた仮名漢字変換の精度向上効果の推定
- マルコフモデルを用いて漢字かな混じり文候補を選択する方法
- 日本語文音声出力からの読み情報を用いた漢字かな混じり文 : 節候補の絞り込み
- 品詞ならびに漢字かな文字のマルコフ連鎖確率情報を用いた文節漢字かな列候補の絞り込み法
- マルコフ連鎖モデルによる文節かな漢字変換候補の絞り込み方法
- マルコフ連鎖モデルを用いた日本語文の置換型, 挿入型及び脱落型誤りの検出・訂正法の改善
- スキップタイプのマルコフ連鎖モデルを用いた日本語文の脱落誤り文字列の検出と訂正法
- マルコフ連鎖モデルを用いた日本語文誤り検出法の改善
- m重マルコフ連鎖モデルを用いた日本語の誤字・脱落・誤挿入誤り文字列の検出と訂正法
- スキップマルコフ連鎖モデルを用いた日本文の誤り検出、訂正方法
- スキップマルコフ連鎖モデルを用いた日本文の誤り検出、訂正方法
- 音声対話文に含まれる離散的な言い直し表現の抽出法
- 単語辞書引きを用いたべた書きかな文の仮文節境界の補正方法
- 日本語文の複合誤り文字列の検出訂正法
- N-gramを用いた対話文の言い直し表現の検出法
- 日本語文の相互干渉誤り文字列の検出・訂正方法
- N-gramを用いた対話文の言い直し表現の検出法
- 2重マルコフモデルを用いたべた書きかな文の仮文節境界の推定方法
- 単語マルコフモデルを組み合わせた仮文節境界の補正法
- 文の先頭・末尾位置を考慮したべた書き日本語文の検出・訂正効果
- 双対オートマトンに基づいた適合性試験の誤りシーケンスの実現手順
- マルコフモデルによる音節文ラテイスからのキーワード候補の絞り込み
- 3重マルコフモデルによるべた書きかな文の仮文節境界の推定法
- マルコフモデルを用いたOCRからの誤り文字列の訂正効果
- 置換誤りを含んだべた書きかな文の仮文節境界の推定方法
- アクセント位置情報を用いた文節単位の音節候補列の絞り込み効果
- 音節マルコフモデルによる日本語音節会話文ラテイスからのキーワード抽出法
- 置換誤りを含んだべた書きかな文の仮文節境界の推定法
- マルコフ連鎖モデルによるかな文と英語文の誤り訂正
- マルコフ連鎖モデルによる日本語文と英語文の誤り検出評価
- べた書きかな文の仮文節境界の補正方法
- べた書きかな文の仮文節境界の補正方法
- m重マルコフモデルによる日本語の誤字、脱落及び挿入誤りの検出法
- 2重マルコフモデルによる日本語文の誤り検出並びに訂正法
- 順方向、逆方向並びに中間タイプの2重マルコフ連鎖モデルによる日本語の誤字訂正候補選択の効果
- 2重マルコフモデルの全域法と局所法による日本語の誤字訂正効果
- 音節テラィスに適用するビタービアルゴリズムの評価について
- 日本文音節入力に対して2重マルコフ連鎖モデルを用いた漢字仮名交じり文節候補の抽出精度
- m重マルコフモデルを用いた音節ラティスからの候補絞り込み手法について
- 2重音節マルコフモデルによる日本語の文節音節認識候補の曖昧さの解消効果
- 日本文校正支援システムにおける評価方法の考察
- 2重マルコフ音節連鎖確率を用いた日本語音声認識後処理