統計的音声生成モデルに基づく任意話者の調音運動の逆推定(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では、統計的音声生成モデルに基づく、任意話者の音声からの調音運動の逆推定法を提案する。本モデルは、音素毎に作られる調音運動に対するHMM(隠れマルコフモデル)と、HMMの各ステート毎に調音パラメータを音響パラメータに変換する調音・音響マッピングにより構成される。また、モデルは、磁気センサシステムを用いた連続発声の調音運動と音声の同時観測データにより統計的に作成される。本論文では、与えられた音声から上記モデルの調音・音響マッピングを適応する手法を提案し、その有効性を示す。
- 社団法人電子情報通信学会の論文
- 2003-06-20
著者
-
誉田 雅彰
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
廣谷 定男
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
誉田 雅彰
日本電信電話株式会社nttコミュニケーション科学基礎研究所 Crest Jst:(現在)早稲田大学スポーツ科学部スポーツ医科学科 Crest Jst
関連論文
- 人間形発話ロボットによる人間の発話メカニズムの解明
- ユーザの嗜好に適応させた選曲システムの提案
- 3次元人間形発話ロボットにおける共鳴特性の向上を目的とした声道機構の開発(合成,生成,韻律,一般)
- 人間に近い音声生成を目指した発話ロボットの開発
- 無声子音における舌・唇と喉頭の調音運動の時間関係の分析
- 無声子音における調音・声門運動のタイミングの分布 - 促音の有無による比較 -
- 可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定
- 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出
- 座談会 : 音声研究を語る : (小特集:)
- 発話動作における時間軸修正量と補償動作の関係(聴覚・音声・言語とその障害,一般)
- 調音と脳活動の計測による音声知覚の運動理論の検証(聴覚・音声・言語とその障害,一般)
- 無声子音発声時の舌・喉頭運動における発声の強さの影響(聴覚,音声,言語とその障害)
- 無声子音の発話運動における発声の強さの影響の分析
- 音声生成における発話協調動作機構
- 促音が先行する無声子音の調音・声門運動タイミングの分析
- 口蓋形摂動に対する調音補償動作の分析
- 無声子音の生成における声門運動の時間パタンの分析
- 無声子音生成における調音器官と声門の運動タイミングの分析
- 音響調音対コードブックを用いた音声からの調音運動の逆推定
- 逐次連続動作の軌道の運動学的構成法
- NN順逆モデリングを用いた人間形発話ロボットの声帯振動制御
- 生理学的構造に基づく人間形発話ロボットの声帯機械モデル(機械力学,計測,自動制御)
- ロボットにおける発話(ロボットにおける音響技術)
- 人間形発話ロボットの3次元舌機構の構築
- 08測-2P-P29 色情報を用いたサッカー映像における選手の自動追跡(08.測定評価,一般研究発表抄録)
- 音声認識のためのダイナミック非線形手法
- 位相等化処理に基づく線形予測法を用いた頑健な声道スペクトルの推定(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- K_005 ロボットの状況判断モデル構築のための人物動作分析(K分野:ヒューマンコミュニケーション&インタラクション)
- 調音音声符合帳探索を用いた調音パラメータの推定
- J_020 ディジタルアクタシステム実現のための感情表出モデルの構築(J分野:グラフィクス・画像)
- I_055 デジタルカメラワークによるサッカー映像生成(I分野:画像認識・メディア理解)
- 音素列情報を加味した連続音声から調音運動の復元方法
- 調音運動から見たパラ言語情報の生成
- 多次元不変特徴タスクに基づく調音運動の軌道生成
- 多次元不変特徴タスクを用いた調音運動の軌道生成
- 科学技術振興事業団 戦略基礎研究推進事業(CREST) : 発声力学に基づくタスクプランニング機構の構築 : (小特集:)
- 人に迫る発話工学 : 人の発話をいかに観測し真似るか (話す仕組みを巡って : 発話機構研究の最前線)
- 磁界のパラメトリック表現を用いた磁気センサシステムの検討
- 人間形発話ロボットによる母音および子音発声の実現 : 第3報,より人間に近い発声を目指した新型発話ロボットの開発(機械力学,計測,自動制御)
- 音響特徴を用いた発話ロボットの声道形状の最適化
- 発話ロボットの弾性体柔軟舌形状のモデル化および音響モデルとの統合(機械力学,計測,自動制御)
- 人間形発話ロボット : 喉を震わせ口を動かして発話するロボット
- 統計的音声生成モデルに基づく任意話者の調音運動の逆推定(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
- 調音運動の逆推定における話者適応化法
- 統計的音声生成モデルに基づく調音運動の逆推定法
- 瞬時周波数アトラクタに基づく正弦波分析合成法
- HMMに基づく音声からの調音運動の逆推定
- 声を出す仕組み (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 発話機構の計算論的研究 (特集 人間の情報処理システム--言語と脳科学)
- 3次元磁気センサシステムにおける測定誤差要因に関する検討
- 磁界のスプライン表現を用いた3次元磁気センサシステムの検討
- 3次元磁気センサシステムの位置推定精度の検討
- 磁気センサシステムの磁界表現における平滑化スプラインの利用
- 磁界のスプライン表現に基づいた磁気センサシステムの検討
- ダイナミクスモデルを用いた/vbv/発話における不変量の検討
- 損失声道モデルに基づく口唇インパルス応答からの声道断面積関数推定
- 2A1-D12 感覚フィードバック系を有する人間形発話ロボットの開発
- 発話運動データに基づく人間形発話ロボットの制御(音声生理研究の方法)
- 位相等化処理に基づく声門閉鎖区間線形予測法の検討 (音声)
- 口唇ダイナミクスモデルを用いた/VCV/発声における不変特性の検討 (音声)
- 子どもの声道発達と音声の特性変化(子どもの音声)
- 口唇ダイナミクスモデルを用いた/VCV/発声における不変特性の検討(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
- 位相等化処理に基づく声門閉鎖区間線形予測法の検討(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
- 位相等化処理に基づく声門閉鎖区間線形予測法の検討
- 母子の身体接触を伴う遊びにおける動作と発話の時系列分析(あそび,「身体,あそび,コミュニケーション」及びコミュニケーション一般)