基本周波数及び音素持続時間を考慮した音声合成用波形素片データセットの作成
スポンサーリンク
概要
- 論文の詳細を見る
テキスト音声合成のために基本周波数(以下, Fo)及び音素持続時間を考慮した波形素片データセットを効率的に作成することを目的として ,Fo・音素持続時間の出現頻度分布予測を取り入れた評価規準を用いてテキストデータベースから発声用の文セットを抽出する方法を提案する. 放送用原稿, 新聞記事などのテキストデータベースから500文を抽出する実験を行ったところ, 82.6%のカバレッジが得られた. また, この文セットを発声リストとして音声を収録したところ, カバレッジは72.9%であった. Fo・音素持続時間を考慮せずに作成した同じ文数の一般的な音素バランス文を発声して得られた音声データベースと比較したところ, 全体のカバレッジでは1.13倍であり, 同じ力バレッジを得るために必要な文数は1/2であった. これらのことより, 本方式の有効性が示された.
- 1999-08-25
著者
-
樋口 宜男
KDD研究所
-
河井 恒
株式会社kddi研究所音声処理グループ
-
樋口 宣男
Kdd研究所
-
河井 恒
KDD研究所
-
河井 恒
(株)KDDI研究所
-
樋口 宜男
(株)KDD研究所
-
山本 誠一
同志社大学工学部
-
山本 誠一
(株)KDD研究所
関連論文
- テレビ視聴環境を利用した顔認識のための変動学習
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- 音楽情報検索向け類似テキスト検索システムの試作(音楽情報検索)
- 携帯電話音声に対する主観評価の精度及び客観評価尺度PESQの有効性の検証(一般)
- B-7-90 VoIPサービス向け通話品質評価手法
- B-6-57 総合音声伝送品質率に基づくヘッダ圧縮処理の制御に関する一検討(B-6.ネットワークシステム,一般講演)
- 転送特性が非対称なワイヤレスリンクにおけるヘッダ圧縮性能向上に関する検討(Webサービスベースのオフィスアプリケーション・ネットワーキング・マネジメント及び一般)
- B-6-124 転送特性の異なる複合IP網における会話型アプリサービス提供に関する一検討(B-6.ネットワークシステム, 通信2)
- 背景雑音を含む携帯電話音声に対するMOS評価の精度推定とPESQの有効性検証
- B-6-115 ワイヤレスIP網におけるRTPパケット受信バッファ制御に関する一検討(B-6. ネットワークシステム, 通信2)
- 無線 IP 網上における区間分割型 QoS 情報通知機能に基づくメディア品質制御手法
- 無線IP網上における区間分割型QoS情報通知機能に基づくメディア品質制御手法
- 波形素片接続型音声合成システムの検討
- アンサンブル学習に基づく音韻継続長のモデル化(合成, 生成, 韻律, 一般)
- 分散型音声認識の商用システム構築(特別企画「音声認識デベロッパーズフォーラム」)
- B-15-16 統合PDA端末の開発(6) : 分散型音声認証システムの実装(B-15. モバイルマルチメディア通信, 通信1)
- 混合分布HMMにおけるTree-basedクラスタリング(音声情報処理 : 現状と将来技術論文特集)
- D-14-9 電話音声認識を用いた株価情報案内システム
- SP2000-10 多数話者電話音声データベースを用いた話者クラスタリング
- 大語彙汎用音声認識エンジンの評価
- 大語彙汎用音声認識エンジンの開発
- 多数話者電話音声データベースを用いた話者クラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 音声信号の途切れ・オーバーフローへのMissing Feature Theoryの適用
- 韻律生成HMMのための学習データ作成ツール
- 音声翻訳システムのための声質変換法と日中英語間における評価
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 多言語音声の合成
- テキスト指定型話者照合におけるしきい値設定法(音声情報処理 : 現状と将来技術論文特集)
- 連続数字認識を利用した悪戯電話排除システム
- 音声認識のためのCS-ACELP符号の音響パラメータ変換方式
- 高齢者用HMMによる認識実験
- 話者モデル学習時の尤度上昇幅を用いた話者識別手法
- 話者モデル学習時の尤度上昇幅を用いた話者照合閾値設定法
- 複数N-gramの利用による音声認識性能改善効果
- 不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
- 話者モデル学習時の尤度上昇幅を用いた話者照合閾値設定法
- 最ゆう状態系列を用いた実時間ケプストラム平均値正規化の検討
- リジェクションを用いた音声始端検出法の改良
- 電話音声認識におけるケプストラム平均値算出法の改良
- 最尤状態系列を用いた実時間ケプストラム平均値正規化の検討
- 少数マイクロホンを用いた音声入力手法の検討(立体音響・トランスデューサ/一般)
- 大規模コーパスを用いた音声合成システムXIMERA(音声,聴覚)
- 音声合成システムXIMERAにおける日本語合成音の自然性劣化要因の分析
- コーパス・ベース音声合成システムXIMERA(一般, 一般, チュートリアルレクチャー)
- コーパス・ベース音声合成システムXIMERA
- ATRにおける中国語テキスト音声変換システム
- 品詞列の分析にもとづく中国語音声のポーズ予測(合成・生成,韻律,一般)
- 平均スペクトル等化の検討(合成, 韻律, 生成, 一般)
- セグメンテーション誤差最小規準にもとづく音素セグメンテーション用HMMの識別学習(合成, 韻律, 生成, 一般)
- 自動ラベリングされた中国語音声コーパスにおける声調の検証
- 中国語基本周波数パターンの自動ラベリング手法
- 統語情報を利用いた中国語韻律境界の自動検出
- 句レベルの韻律を考慮した中国語音声合成のための音声コーパス設計
- 中国語の音声合成のための音韻と韻律を考慮したテキストコーパス
- A-10-7 2段階DOA推定法に基づく音源分離手法の評価(A-10.応用音響,一般講演)
- 波形接続型音声合成における素片選択遅延時間の短縮(音声,聴覚)
- 素片接続型音声合成における最良優先探索に基づく素片選択(一般, STRAIGHTスペシャルセッション(SS))
- 波形接続型音声合成における連続素片優先探索の効果(合成, 生成, 韻律, 一般)
- 幅優先探索に基づく短遅延素片選択アルゴリズムの評価
- 短遅延素片選択におけるビーム幅制御の検討
- 短遅延音声合成のための素片選択法(合成・生成,韻律,一般)
- 波形素片接続型音声合成のための音声データの収集
- トピックス20 Speak & SpellとDECtalk(〈特集〉-音響学における20世紀の成果と21世紀に残された課題-)
- 連続数字認識における低認識率話者の分析
- 音声認識を利用した携帯電話サービスの開発(パネルディスカッション「音声認識技術の実用化」)
- 音声合成用大規模音声コーパスの構築(チュートリアル: 音声収録から始めるコーパスベース音声合成, 一般, チュートリアルレクチャー)
- 無線 IP 網上における区間分割型 QoS 情報通知機能に基づくメディア品質制御手法
- 電話網経由の連続数字音声認識システムの試作
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定 (音声)
- 連続数字発話を対象としたHMMの誤り最小基準による識別学習
- 話速変換によって発話速度を低下させた英語音声の了解性の評価
- 行列によるトレリス計算を用いたHMMの文レベルでの識別学習
- 基本周波数および音素持続時間を考慮した音声合成用波形素片データセットの作成
- 数字を用いた話者照合方式の検討
- 数字を用いた話者照合方式の検討
- 数字を用いた話者照合方式の検討
- 中国語音節の音素と声調の代替接続による自然性劣化の知覚的評価
- 文のクラスタリングに基づく統計的言語モデル
- 文クラスタ混合分布N-gramの検討
- 文クラスタ混合分布N-gramの検討
- 文クラスタ混合分布N-gramの検討
- パラメ-タ導出型日本語音声規則合成装置の評価 (新しい音声処理技術特集)
- テキスト編集機能付き音声規則合成装置の試作
- ワ-プロ機能付き音声規則合成装置--パソコント-ク
- 基本周波数及び音素持続時間を考慮した音声合成用波形素片データセットの作成
- 隣接単語間の結合関係に着目したテキスト音声変換用形態素解析処理
- 音声器官の動きに着目した音素持続時間の制御
- ボイスダイヤリングシステムの現状 (コンピュータと通信)
- 電話網経由の連続数字音声の認識実験
- 電話網経由で収集した数字音声の認識実験
- 電話網経由の連続数字音声の認識実験
- 日本語文章音声の合成のための無声化規則
- 隣接音素の統計的性質に基づくホルマント型音声合成方式
- テキスト編集機能付き日本語音声規則合成装置における韻律制御
- パラメータ導出型日本語音声規則合成方式における調音制御