言語モデルと音響モデルを利用したアクセント句境界の自動推定

スポンサーリンク

概要

論文の詳細を見る
テキスト音声合成システムの構築にはアクセント情報に関する韻律情報ラベルが付与された音声データが必要不可欠であるが,アクセント情報の付与は主に人手で行われており高コストである.そこで本研究では,音声データの自動ラベリングを目的としたアクセント句の境界推定手法を提案する.提案手法では,音声を書き起こしたテキスト情報だけでなく,音声から得られる F0 などの音響特徴量を使用する.アクセント句境界モデルおよびアクセント型モデルといった言語モデルには条件付き確率場 (CRF) を,そして音響モデルに隠れマルコフモデル (HMM) を使用し,それらを組み合わせてアクセント句の境界を推定する.本稿では,読み上げ音声に対するアクセント句境界推定実験を行い,従来法に比べ推定精度が向上することを示した.
2013-12-12

著者

関連論文

もっと見る

スポンサーリンク