韻律制御パラメータ数を考慮した評価尺度に基づく韻律句境界の自動検出
スポンサーリンク
概要
- 論文の詳細を見る
規則音声合成システムの構築に必要な音声データのラベリングの自動化を目指して, 音声の基本周波数 (以下 F_0) の時系列パターンをもとに, 韻律制御単位の一つである韻律句の境界を自動的に検出する手法を提案した. 本手法では, さまざまな韻律句境界の位置を仮説とした F_0 パターン分析を行いその結果をもとにそれぞれの仮説の適切さを比較して最も評価の高い仮説を韻律句境界の検出結果とする. 韻律句境界位置の仮説の適切さを定量化するため, 従来用いられてきた F_0 推定誤差に加えて, F_0 制御モデルパラメータの統計的特徴から求まるパラメータ値のもっともらしさや, 仮定している韻律句の数を適切に抑えることを考慮した評価尺度を提案する. 提案手法をテストデータ250文に対して適用した結果, 従来手法と比べて韻律句境界検出率が27.3%向上することが判明した.
- 社団法人電子情報通信学会の論文
- 1997-02-25
著者
-
匂坂 芳典
(株)エイ・ティ・アール音声翻訳通信研究所
-
平井 俊男
(株)エイ・ティ・アール音声翻訳通信研究所:(現)(株)オージス総研
-
樋口 宜男
Atr音声翻訳通信研究所
-
樋口 宜男
(株)エイ・ティ・アール音声翻訳通信研究所:(現)国際電信電話株式会社
関連論文
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- 韻律ラベリングシステムJ_ToBIのラベル情報を用いた重畳型基本周波数制御モデルパラメータの自動抽出
- 韻律ラベリング・システムJ_ToBIを用いた基本周波数制御規則の自動抽出
- 波形接続型音声合成システムCHATRの基本周波数に関する音素単位選択規準の改良
- 韻律制御パラメータ数を考慮した評価尺度に基づく韻律句境界の自動検出
- 統計的手法を用いた基本周波数制御規則の自動抽出
- 複数話者の音声データベースから自動生成されたF_0制御規則の分析
- 臨界制動モデルパラメータの分布特性を用いたフレーズ境界の自動推定のための尺度の検討
- 統計的手法を用いた基本周波数パタン制御指令の自動分類
- 話者選択と移動ベクトル場平滑化を用いた声質変換における写像元話者の選択方法
- 雑音環境下における音声の個人性知覚の分析
- 話者選択と移動ベクトル場平滑化による声質変換のためのスペクトル写像
- 音声の個人性知覚に影響を及ぼす音響的特徴の分析
- 音声の個人性知覚における既知話者/未知話者の影響
- SSVFSを用いた発話特徴模擬システムの構築とSSVFSにおける写像元話者設定法の検討
- 音素内最適経路探索を用いた単位接続型音声合成方式
- 個人性の判別に影響を及ぼす音響的特徴の分析
- 話者選択と移動ベクトル場平滑化を用いた声質変換のためのスペクトル写像
- 話者選択と移動ベクトル場平滑化を用いたスペクトル写像による声質変換の検討
- 個人性の知覚に影響を及ぼす音響的特徴の分析
- Complex RBFネットワークを用いた音声変換方法
- 逆フィルタ波形の勾配を用いた音声波形の極性の検出
- STRAIGHTを用いたCHATRの韻律制御
- 日本人の姓のアクセント型推定
- 韻律を用いたテキスト非限定型発話アクト識別方法
- 音素内最適経路探索を用いた可変長単位接続音声合成方式
- 確率文脈自由文法を用いた韻律句境界とポーズ位置の予測
- 確率文脈自由文法を用いた韻律句境界の推定
- 発音ネットワークに基づく発音辞書の自動生成
- 統計処理による入力文から中間表現への変換を用いた音声言語理解
- 品詞および可変長形態素列の複合N-gramを用いた日本語形態素解析
- 最大事後確率推定によるN-gram言語モデルのタスク適応
- 品詞および可変長単語列の複合N-gramの自動生成
- 中間言語表現の生成を目的とした統計的音声理解方式(音声情報処理 : 現状と将来技術論文特集)
- 音声の個人性知覚に影響を及ぼす音響的特徴の定量的分析