韻律を考慮した音声素片を用いる日本語テキスト音声合成
スポンサーリンク
概要
- 論文の詳細を見る
テキスト音声合成における音韻パラメータの生成方式について述べる。一般に、規則合成の音韻生成では、与えられた音素記号列に対する音韻パラメータの生成が課題とされるが、自然音声では、音韻パラメータの変動要因は多種多様である。そこで、我々は韻律パラメータと音韻パラメータの関係を明確化し、音韻制御に韻律パラメータを利用することを検討している。合成単位として音韻環境のみを考慮した音素パタンを利用する場合と、韻律を考慮したパタンを用いる場合を比較する実験を行った。自然音声の母音および撥音について、同一の音素環境の平均パタンと、ピッチ周期、パワ、継続時間長のそれぞれが閾値以内のデータの平均パタンとのスペクトル歪みを分析したところ、後者を用いた場合、歪みが減少し、特にピッチ周期、パワをパラメータとして合成単位を作成した場合に良好な結果が得られることが確認され、方式の有効性が示された。
- 社団法人電子情報通信学会の論文
- 1998-11-19
著者
-
石川 泰
三菱電機・情報総研
-
石川 泰
三菱電機株式会社情報技術総合研究所
-
石川 泰
三菱電機(株)・情報総研
-
中島 邦男
三菱電機株式会社情報技術総合研究所:(現)横浜国立大学産学連携推進本部
-
中島 邦男
三菱電機株式会社情報技術総合研究所
-
石川泰
三菱電機
-
石川 泰
三菱電機株式会社
-
中島 邦男
三菱電機・情報技術総合研究所
関連論文
- 9.パターン認識・マルチメディア技術 : 今後の技術と新たな産業創出(情報処理技術の未来地図,50周年記念特集号)
- 音声認識応用に関する学会試行標準
- D-14-10 音声認識におけるリジェクトのためのスコア正規化方法の検討(D-14. 音声・聴覚)
- D-14-16 音素脱落を許す単語モデルを用いた日本人英語の認識
- VQ写像を用いた2入力SSによる非定常騒音下の音声認識
- 日本人英語認識におけるマルチ単語モデルの改良
- 複数単語モデルによる日本人英語音声認識の検討
- 日本人英語の発話様態を考慮した英語音声連続認識の検討
- 発声変形モデルを用いた騒音環境下音声認識
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- パターン認識・マルチメディア技術 : 今後の技術と新たな産業創出
- 音声UI設計とその評価 -普及促進に向けて,システム構築の立場から-
- [パネルディスカッション]音声認識技術がキャズムを越えるには?
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- ものづくり作業における発話分析に関する検討 (テーマ 社会的なインタラクション研究の新展開)
- 最大エントロピー法による発話理解のための効率的モデル構築(音声言語情報処理とその応用)
- 最大エントロピー法による発話理解モデル構築のための効率的学習方式
- 音声対話技術 (特集 IT時代のヒューマンインタフェース技術)
- 最大エントロピーモデルによる発話意図の同定と素性選択アルゴリズムの効率化
- テキスト音声合成における統計的言語情報を利用した基本周波数制御
- 電話の相手はコンピュータ? : 電話系音声認識とその応用
- 統計的言語特徴を利用したテキスト音声合成の韻律制御
- テキスト音声合成における統計的言語情報を利用したポーズ予測
- テキスト音声合成における統計的言語情報を利用した韻律制御
- テキスト音声合成における統計的言語特徴を利用した韻律制御B30641999090133TITE Prosodic Control for Text-Speech system Using Statistical Language Features
- テキスト音声合成におけるピッチ制御と言語情報
- 韻律を考慮した音声素片を用いる日本語テキスト音声合成
- 韻律を考慮した規則合成の音声素片
- 対話文脈を利用した概念素に基づく音声理解
- 概念素に基づく音声理解への統計的言語制約の導入
- 音声対話における話題推定に基づいた情報提供手法
- 概念素理解方式による音声理解への統計的言語制約の導入
- 対話システムのための概念素理解方式による対話音声理解
- 対話システムのための概念素理解方式による一般的文意理解
- ユーザの行動目的の推定による協調的な音声対話制御
- 三菱メ-ルテレフォニ-サ-バ"CallMail"
- イントラネットにおける電話の利用 : 電子メール読み上げシステムの開発
- D-14-13 学習データ量の年代別偏りを考慮した音響モデル構築方式の検討(D-14. 音声・聴覚)
- D-14-12 車室内で発生する規則性非定常騒音下での音声認識
- VQ写像を用いた2入力SSによる非定常騒音下音声認識の検討 - 自動車内走行騒音への適用 -
- D-14-21 音声認識における特徴ベクトルの補間及びフレーム間引き手法の検討
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- SD-3-3 N-gramモデルを用いた音声対話システムのための音声認識の検討
- D-14-20 音声対話システムにおける少量テキストを用いた言語モデルのタスク適応に関する検討
- 自由発話音声認識のためのトライ音節モデルの検討
- 音声対話システムにおける教師なし話者適応の検討
- 音声対話システムにおける湧き出し誤りのリジェクト方式の検討
- 認識結果の信頼度を考慮した教師無し話者適応方式の検討
- 波形コードブック利用合成方式のTTSへの適用
- 規則合成のための波形データの圧縮法
- 三菱メールテレフォニーサーバ(CallMail)
- 簡略化したネットワークモデルによるピッチパターン制御とTTSシステムへの組み込み
- 韻律生成ネットワークモデルにおけるピッチ予測精度向上の検討
- 音声合成におけるネットワークモデルによるポーズ位置予測
- ピッチパターン生成ネットワークモデルにおけるポーズ位置推定の検討
- ピッチパターン生成ネットワークモデルにおける意味情報の利用の検討
- ネットワークモデルによる文ピッチ生成法
- テキスト音声変換におけるピッチパターン生成方式の検討
- 文音声のFO制御における言語情報を用いた精度向上法の検討
- 第5回ヨーロッパ音声通信技術会議(EuroSpeech'97)
- 日本語規則合成のための2モーラを単位とする音韻継続時間長規則
- 規則合成における2音節を単位とする音韻継続時間長制御
- 韻律を考慮した規則合成単位の評価
- 韻律を考慮した音声素片を用いる規則合成
- 韻律を考慮した音声素片を用いる規則合成方式
- 音声インタフェースの評価
- IT時代のヒューマンインタフェース--現状と展望 (特集 IT時代のヒューマンインタフェース技術)
- 音声合成を利用するWWWブラウザの検討
- アプリケーションの機能構造に基づく音声インタフェースの提案と評価(インタフェース)
- UI設計とユーザビリティ : 音声インタフェースの課題(音声認識実用化に向けて)
- 音声認識の実用化の阻害要因と課題 : 音声インタフェースのユーザビリティ評価(音声認識の実用化の阻害要因と課題,特別企画「音声認識デベロッパーズフォーラム」)
- Q&Aコーナー(コーヒーブレーク)
- テキスト音声合成における発話スタイルと継続時間長制御の検討
- テキスト音声合成技術 (特集 IT時代のヒューマンインタフェース技術)
- テキストコーパスを用いた複合語アクセント句の決定方法
- ユーザの行動目標に基づく対話管理手法
- 音声合成のための韻律制御の基礎
- 2000-SLP-32-9 三菱電機における音声情報処理技術の開発
- 機械との対話における対話の維持と印象
- 音声合成はどこまで肉声に近づけるか
- 音声対話システムの評価法(音声対話システムの実力と課題)
- 文発声における音韻継続時間長制御
- 規則合成のための2モーラを単位とする音韻継続時間長規則 : 単位内時間構造の特徴
- 2モーラを単位とする音韻継続時間長制御規則の評価
- 2モーラを単位とする音韻継続時間長規則
- 2モーラを単位とする音韻継続時間長制御 -ポーズ長, 個人性の検討-
- 概念依存関係を用いた概念素理解方式の音声理解性能の評価
- 概念素理解方式における不要語・未知語を考慮した文意探索手法
- 概念依存関係による概念素統合に基づいた音声理解
- 音声合成の新たなステップに向けて
- 2モーラを単位とする音韻継続時間長制御規則 -文音声の検討-
- 概念素理解方式の一般化とタスク知識の適用手法
- 概念素に基づく意味理解における言語知識の詳細化
- 概念素に基づく意味理解の文の表現性の拡張
- 概念素に基づく意味理解における音声認識への統合手法
- 概念素探索法における概念素仮説からの文意統合方式
- PS-055-1 蛍光法を併用した乳癌センチネルリンパ節生検における至適摘出リンパ節個数についての検討(PS-055 乳腺 センチネル-3,第112回日本外科学会定期学術集会)
- PS-272-4 蛍光法併用乳癌センチネルリンパ節生検陽性例からみた腋窩リンパ節郭清省略の可能性(PS ポスターセッション,第113回日本外科学会定期学術集会)