ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング

スポンサーリンク

概要

論文の詳細を見る
入力音声のピッチパタンを用いて韻律的な句境界尤度を算出し, 音響尤度と統合してスポッティングスコアを求める文節スポッティング方式を検討した。句境界尤度を統合することにより, 文節スポッティングにおいて不適切な区間での湧き出し誤りを低減できる。句境界尤度は句の代表的なピッチパタンをモデル化した複数個のHMNを用いてフォワード・バックワードアルゴリズムによって求める。本方式を読み上げと自由発話の連続音声で評価した結果, 両発話様式で文節スポッティングの精度が改善されることを確認した。また短い冗長語を含む自由発話ではピッチパタンのモデル化には状態数の異なる2種類のHMNの組み合わせが有効であった。
社団法人日本音響学会の論文
1998-12-25

著者

関連論文

もっと見る

スポンサーリンク