基本周波数とスペクトルの漸次変形による音声モーフィング
スポンサーリンク
概要
- 論文の詳細を見る
本報告では、新しい音声処理の応用として、音声モーフィングを提案する。画像処理のモーフィングでは、猫の顔を徐々に人間の顔へと変形するデモ等がある。これに類似したことを音声処理で行なう。処理の概略は、「ある話者の音声を徐々に他の話者の音声へと変化させること」である。提案する音声モーフィング方式は、基本周波数とスペクトルとを時々刻々と変化させることによって話者性を変化させる。20人の話者のデータを用いて聞き取り実験を行い、音声モーフィングを行なうための基本検討を行なった。その結果、(1)音声スペクトル操作の効果は、2話者間のスペクトルの差に着目することで予測できること、(2)基本周波数とスペクトルの相対的な関係が話者性に与える影響、(3)滑らかな音声モーフィングを行なうための目安を明らかにした。
- 1996-07-19
著者
関連論文
- FoundeVision : ヒストグラム変換を用いたリアルタイム顔映像印象向上手法
- GPS未計測区間における移動手段判定手法の検討(セッション2)
- ライフログのための位置情報ログデータからの移動モード判定の検討(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- ライフログサービスに向けた屋内におけるユーザとモノの位置推定
- ライフログサービスに向けた屋内におけるユーザとモノの位置推定(ライフインテリジェンス,デジタルドキュメント,一般1,知識の共有・伝承・知的活用に関するシステム・技術,一般)
- 自動ラベリングのためのHMM学習データ量の検討
- 形態素・音韻連鎖を考慮した音声合成コーパス用文セット生成の検討
- HMM音素モデルによる自動ラベリングのロバスト性の検討
- 音声メッセージ制作支援ツールSesign (特集論文2 コンテンツ流通基盤技術)
- コーパスを用いた歌唱ピッチパタンの自動生成
- 音声デザインツールSesign
- テンプレート・テキスト合成方式とCGキャラクタエージェントWebMessengerを用いたコンテンツ制作
- 対話型自動プレゼンテーションシステム
- マルチフォームユニットによるテキスト音声合成システム
- 音声作成ツール : Sesign99
- 躍動感のある音声合成インタフェースとCAIシステムへの応用 (特集 ここまできた音声認識・音声合成)
- 音声メッセージ制作システムSesign99 (特集 ここまできた音声認識・音声合成)
- WebMessenger:合成音声と動画像テンプレートを利用したコンテンツ制作フレームワーク
- 音声表現力と制作効率を向上させた音声作成ツール-Sesign98-
- CAIシステムの内部状態を合成音声によって伝達する方法の検討
- CALTURE : 合成音声を用いてインタラクティブに教示するペン習字CAIシステム
- 合成音声によるインタラクティブな教示音声をCAIシステムへ導入するための検討
- 合成音声によるリアクションがユーザーに与える印象について -合成音声の韻律と印象との関係-
- ハイブリッドスケーラブル型音声合成方式
- 規則合成音声で躍動感を実現する方略について
- 携帯電話を用いた災害時情報共有システムにおける入力手法の検討(コミュニケーション一般,HCGシンポジウム)
- 3H-1 ベッド上の人の起き上がり動作の検知を目的としたセンサ情報処理の検討(医療分野への応用(2),一般セッション,コンピュータと人間社会)
- リアルタイム顔色彩転送手法(ITS画像処理,映像メディア及び一般)
- リアルタイム顔色彩転送手法(映像システム,ITS画像処理,映像メディア及び一般)
- A-14-10 携帯電話を用いた災害時情報共有システムにおける入力手法の検討(A-14. ヒューマンコミュニケーション基礎,一般セッション)
- ライフログのための位置情報ログデータからの移動モード判定の検討(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- リアルタイム顔色彩転送手法(映像システム,ITS画像処理,映像メディア及び一般)
- 専門家による映像補正技法に基づいたリアルタイム顔映像印象向上手法(セッション5,あったかいインタラクション)
- ライフログ活用技術とその課題 : 将来オフィスなどの応用分野でライフログは活用されるか?(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- ライフログ活用技術とその課題 : 将来オフィスなどの応用分野でライフログは活用されるか?(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 狭帯域音声からの擬似広帯域音声の生成法 (特集論文 テキスト音声合成とその多様化技術)
- コードブックマッピングによる狭帯域音声から広帯域音声の生成法
- 音節区分化モデルに基づく基本周波数の2階層制御方式
- 異なる発話様式の特徴分析
- 音声合成のための合成単位の基礎
- 振幅スペクトルの微細成分を取り入れたボコーダ型音声合成方式
- STRAIGHTによる音素片の韻律変形と音質の関係
- テキスト音声合成を用いた遠隔からのデータベースアクセスシステム
- ロボットインタフェースを利用した非同期コミュニケーションの保育への適用及びその評価(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- ロボットインタフェースを利用した非同期コミュニケーションの保育への適用及びその評価(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 6U-8 猫の鳴き声の音高特性の分析と生成(音声・歌声合成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6U-7 鳥の大きさを考慮した羽ばたき音の合成方法(音声・歌声合成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 様々な音声表現を実現できる音声作成ツール : Speed97
- 極相互の相関を考慮したホルマント周波数変換法
- フォルマント周波数とスペクトル傾斜の線形区分化規則による声質変換
- 基本周波数の変更量に応じてスペクトル包絡を変形する音声合成方式
- 基本周波数に応じてスペクトル包絡を変形するテキスト音声合成システム
- F_0に応じてスペクトル包絡を変形する音声合成方式の規則合成システムへの適用
- 基本周波数に応じてスペクトル包絡を変形する音声合成法式
- 帯域分割したスペクトル包絡のノン・パラメトリックな変形による声質変換
- 発話様式が制御可能な音声規則合成方式 (特集論文 テキスト音声合成とその多様化技術)
- 音声処理技術を利用した音声コンテンツ制作
- 音声処理技術を利用した音声コンテンツ制作
- 基本周波数とスペクトルの漸次変形による音声モーフィング
- 異なる発話様式の特徴分析とその制御
- 3Q-2 傘の開閉音を利用した鳥の羽ばたき音の合成方法(音声の分析・合成,学生セッション,人工知能と認知科学)
- 2A1-C07 ネットワークロボットプラットフォームを利用した多種ロボット連携の実証実験
- 波形処理による声質変形装置(VarioVoice)
- 誤り指示音声の特徴分析と音声出力への適用
- 呼びかけ音声のバリエーションとその韻律的特徴
- 話者間距離と音声モーフィング効果の関係
- 発話様式のバリエーション (<小特集>声質:音声言語の多様性に迫る)
- 基本周波数とスペクトルの漸次変形による音声モーフィング
- 誤り指示音声の特徴とその効果
- 電話音声の擬似広帯域化処理装置
- 音声変換処理技術 : 基本周波数、継続時間、声質に関して
- ディジタルコンテンツ制作の最新動向~ここまで来たディジタルコンテンツ制作~6.FoundeVision:ヒストグラム変換を用いたリアルタイム顔映像印象向上手法
- 6. FoundeVision : ヒストグラム変換を用いたリアルタイム顔映像印象向上手法(ディジタルコンテンツ制作の最新動向 〜ここまで来たディジタルコンテンツ制作〜)