複数の言語情報を用いたCRFによる音声認識誤りの検出

スポンサーリンク

概要

論文の詳細を見る
近年,音声認識誤りの検出訂正には,誤り傾向を示すn-gramを学習する「誤り傾向学習」という手法が注目されている.この手法には,出現頻度の低いn-gramに対しては適切に学習を行うことができないという問題があると考えられる.また,周辺の単語との意味的類似度をスコア化し,内容語の認識誤りを検出する手法が提案されている.本稿では,特に後者の意味スコアについて検討し,これらの情報を統合した音声認識誤りの検出法を提案する.日本語話し言葉コーパスによる評価実験の結果,「誤り傾向学習」で用いる素性に意味スコアを追加することで,特に内容語において誤り検出性能の改善が得られた.また,単語重みと組み合わせることで意味スコアを有効に活用することができた.
2009-01-22

著者

関連論文

もっと見る

スポンサーリンク