波形接続型Speech-to-Speech音声合成のための可変長音声単位による単位選択手法(合成, 韻律, 生成, 一般)
スポンサーリンク
概要
- 論文の詳細を見る
波形接続型音声合成はその合成音の高い自然性から人気を集めているが,現時点では利用可能な場面は限られており,日常会話への適用にはいくつかの課題が残されている.我々はこれらの課題のうち,ラベリングされた大規模データベースが必要な点,パラ言語情報を考慮したターゲットの作成が困難である点に着目し,Speech-to-Speech合成のための単位選択法を提案する.提案法では,データベース中の音声および入力の音声に対して,波形から抽出できる音響特微量を用いて可変長の音声単位を切り出し,その音声単位をスペクトル情報・韻律情報により特徴付け,その特徴ベクトルの距離計算により単位選択を行う.本稿では大規模音声データベースから音声単位を切り出す技術,そして音響的特徴に基づいた単位選択について提案する.2種類の音声単位切り出し手法を比較し,両手法で切り出されたコーパスを使ったSpeech-to-Speech合成音について,割り当て音素ラベル列によるラベル正解精度,聴覚実験による書き取り正解精度・了解度・自然性を確かめた.
- 2003-08-15
著者
-
柏岡 秀紀
奈良先端科学技術大学院大学情報科学研究科
-
柏岡 秀紀
奈良先端科学技術大学院大学情報科学研究科:情報通信研究機構知識創成コミュニケーション研究センター:国際電気通信基礎技術研究所音声言語コミュニケーション研究所
-
正木 敦之
奈良先端科学技術大学院大学
-
CAMPBELL Nick
奈良先端科学技術大学院大学
-
柏岡 秀紀
奈良先端科学技術大学院大学
-
柏岡 秀紀
奈良先端科学技術大学院大
-
キャンべル ニック
奈良先端科学技術大学院大学
関連論文
- 音響的特徴に基づくノンバーバル発話の意図識別(音声対話・セグメンテーション)
- 統計学習を用いた対話からの非語彙的表現の抽出(音声対話・セグメンテーション)
- 係り受けとF_0の関係に着目した波形接続型音声合成における単位選択の改良の検討
- 波形接続型音声合成におけるF0の傾きを考慮した接続コストの検討
- 波形接続型Speech-to-Speech音声合成のための可変長音声単位による単位選択手法(合成, 韻律, 生成, 一般)
- 音響的特徴に基づくノンバーバル発話の意図識別(音声対話・セグメンテーション)
- 統計学習を用いた対話からの非語彙的表現の抽出(音声対話・セグメンテーション)
- 単語類似度の尺度比較支援ツールの作成(言語知識・解析・言い換え)
- 音響的特徴を用いた話し言葉の断片発話単位への分割(音声合成・声質変換,第10回音声言語シンポジウム)
- 音響的特徴を用いた話し言葉の断片発話単位への分割(音声合成・声質変換,第10回音声言語シンポジウム)
- 音響的特徴を用いた話し言葉の断片発話単位への分割(音声合成・声質変換,第10回音声言語シンポジウム)
- 発話「うん」のパラ言語ラベルによる分類と音響的分析
- 多様な長さの音声単位を用いた単位選択
- 発話速度を考慮した音韻継続時間長制御手法の検討
- 同一表記である疑問文・平叙文の韻律パターンによる判別
- 物語朗読における異なる話速と発話スタイル間の発話時間長制御について
- 発話速度変化による発話時間長
- 音声翻訳システムにおける韻律情報の活用
- 非可聴つぶやき認識(音声,聴覚)
- NAM Interface Communication(音・音声インタフェース)
- NAM Interface Communication(音・音声インタフェース)
- 日本人による英語フレーズ音声の韻律的特徴の分析
- 微弱体内伝導音抽出による無音声認識
- 対訳文選択のための用例翻訳用シソーラスの構築(翻訳)
- 自閉症児支援に向けた笑い声のアノテーション結果分析(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 自閉症児支援に向けた笑い声のアノテーション結果分析(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)