離散HMMを用いた統計的な発音辞書(音声・音響処理)

スポンサーリンク

概要

論文の詳細を見る
非母国語話者の発音には母国語話者に比べて種々の差異が見られる.本稿では,この差をモデル化するための手法として,HMMを用いた発音辞書を提案する.各単語に対するHMMは,まず通常辞書における音素列の各音素を各状態とする形で生成される.続いて,実際の非母国語話者の発声データを用い,それに含まれる単語の音素認識結果を用いて出力確率と遷移確率が学習される.このモデルの使用にあたっては,通常の単語認識結果のN-bestと音素認識結果が必要となる.各N-best単語系列に対し、HMMを用いた発音辞書を使い、音素認識結果の音素系列のビタビ・アライメントを得る。その時のスコアを対応する単語系列の発音スコアとする。最終的に,N-bestの中で最も高いスコアを示すものが,認識結果として選ばれる.当研究所の非母国語英語データベースで行った実験で単語誤り率が45.88%から42.12%に下がった。
一般社団法人情報処理学会の論文
2004-07-16

著者

関連論文

もっと見る

スポンサーリンク