発音ネットワークに基づく発音辞書の自動生成

概要

論文の詳細を見る
自然発話音声では,読み上げ発声では起こらないような,大きな発声変形を生じることがある.このような発声を音声認識しようとした場合,標準的な読みが付与された発音辞書を用いても,正しい認識結果は得られない.つまり,標準的な発音系列と実際に発声される発音系列のミスマッチを緩和する機構が必要である.本稿では,発声内容を標準的な辞書表記に基づいて書き起こした音素系列を標準発音系列とし, この発声を音素認識した結果の音素系列を修正発音系列と見なし, これらの対応関係を発音ネットワークとして構築し, この発音ネットワークを利用して発音辞書を自動的に生成する方法について述べる.本手法は, (1)学習データ中の発声数が少ない語彙に対しても信頼性の高い発音記号列が得られる, (2)任意の認識対象語彙の追加に対して,発音辞書を生成することができるなどの特徴をもつ.自然発話音声認識実験から, この発音ネットワークに基づいて自動生成した発音辞書は,認識性能,認識時間の両面において,従来の標準発音列に基づいた辞書よりも優れていることが分かった.
社団法人電子情報通信学会の論文
1996-12-12