音節強調発声に頑健な自然発話音声の認識法

概要

論文の詳細を見る
自然発話音声には, 正しく意図を伝えるための強調発声や言い直し, 感情表現など, さまざまな発話様式が含まれている.より良いヒューマンインタフェースとして音声認識システムを考えた場合, これらの発話様式の変動に頑健な音声認識システムを構築することは非常に重要である.特に現在の音声認識システムでは, 誤認識の発生は避けられず, その言い直しに対して頑健にする必要がある.言い直し発話では, より明瞭に発声する, 音素継続時間長が増加するという変化が生じるとともに, 音節強調発声の出現頻度が増加するという傾向がある.本稿では, 言い直し発話における音節強調発声に有効な音声認識手法について検討したので報告する.音節強調発声は, 発話様式が孤立音節発声に近くなるとともに, 音節間の音響的特徴が変形する.本手法では, 後続音素環境が無音のtriphone母音モデルと, 先行音素環境依存biphone母音モデルをマルチモデル化して用いることにより, 上記の音節強調発声の問題に対処する.デコードの際, 音素ごとに尤度の高いモデルを選択することで, 認識辞書の拡張や音響モデルの切り替えを行うことなく, 音節強調発声に対する認識率を向上することができた.
社団法人電子情報通信学会の論文
2000-12-15

音節強調発声に頑健な自然発話音声の認識法

スポンサーリンク

概要

著者

関連論文

スポンサーリンク