ゆう度基準による分析周期・窓長の自動選択手法を用いた発話速度の補正と音響モデルの構築

スポンサーリンク

概要

論文の詳細を見る
話し言葉の認識においては,発話速度の変動が認識性能に影響を与えることが報告されており,発話速度の正規化や補正が重要であると考えられる.本論文では発話速度を補正するために,認識時においてゆう度基準により分析周期・窓長を変更する手法を提案する.複数の分析周期・窓長を用いて認識した結果の音響ゆう度・言語ゆう度を比較することにより,発話ごとに適した分析周期・窓長を選択し,結果的に発話速度を補正する.本手法を用いることで,発話速度の変動が大きい講演音声に対して,認識性能が改善されることを確認した.更に,音響モデル学習時に発話速度を補正することを提案する.学習データに対して,複数の分析周期・窓長を用いてビタビアラインメントを行った後,音響ゆう度が最も大きな分析周期・窓長を選択する.本手法を用いて構築した音響モデルを用いて,提案手法により認識を行うことで更に認識性能を改善することができた.
社団法人電子情報通信学会の論文
2003-02-01

著者

関連論文

もっと見る

スポンサーリンク