ニュース音声認識における言語モデルの検討

スポンサーリンク

概要

論文の詳細を見る
ニュース音声は読み上げ音声に比べ音声認識が困難な題材であるが、高齢者・聴覚障害者のための字幕付与サービスなどへの応用が期待されている。今年になって、NHKニュース放送音声のデータベースが構築され、これを対象とした音声認識タスクが研究されている。大語彙音声認識には精度の良い言語モデルが不可欠であるが、本研究では、(1)付属語連鎖・複合名詞を連語として登録し一単語として扱う連語モデル、(2)名詞語彙をタスクに合わせて入れ換える名詞フラットモデル、(3)品詞に基づいて語彙を分類した品詞クラスモデル、という3種類のN-gram言語モデルを作成した。その結果、(1)についてはパープレキシティの改善が見られた。これらの言語モデルをニュース音声認識に適用した結果について報告する。
社団法人電子情報通信学会の論文
1997-12-12

著者

関連論文

もっと見る

スポンサーリンク