MR画像に基づいた変形による生理学的発話機構モデルの個人化(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
スポンサーリンク
概要
- 論文の詳細を見る
生理学的発話機構モデルを用いて発話中の動的・静的特性を系統的に調査することにより,音声生成過程で生じる個人差の要因を明らかにすることが期待される.しかしモデルの構築が容易ではないため,この様な調査はまだ行われていない.本研究では,既に構築されている生理学的発話機構モデルに対し目標話者の形態学的情報を変形により適応する,モデルの個人化手法を提案する.実験の結果,提案手法により,基とするモデルの計算構造を維持したまま目標話者の形状を反映したモデルを効率的に構築できることが確認された.また,要求される精度によっては,手動で抽出する必要がある特徴点の数を削減できることが示された.
- 2012-06-07
著者
-
党 建武
北陸先端科学技術大学院大学
-
川本 真一
北陸先端科学技術大学院大学情報科学研究科
-
党 建武
北陸先端科学技術大学院大学情報科学研究科:天津大学
-
西村 奈々
北陸先端科学技術大学院大学情報科学研究科
-
川本 真一
北陸先端科学技術大学院大学
関連論文
- 高効率エネルギー放射を意図したアンプの研究開発(学生研究発表会)
- D-14-1 素片編集型音声合成における発話スタイルに関する研究(D-14. 音声,一般セッション)
- IECを用いた素片接続コストの重み係数推定
- GMMに基づいた雑音感度関数を用いたロバスト音声認識(聴覚・音声及び一般)
- 母音学習過程における音声知覚と調音変化の関係について
- 3次元MRI動画データと実音声を用いた声道断面積モデルのパラメータ推定
- 3次元舌モデルを用いる母音構音のforce vector及びλvectorに関する検討(音声・聴覚,一般)
- 喉頭モデルでカップリング問題関する数値解析(音声・聴覚,一般)
- 発話機構モデルに基づく音声と調音状態との一対多の関係に関する考察
- 音声と一対多の関係にある調音状態の分布構造 : 発話機構モデルに基づく考察(聴覚・音声・言語とその障害,一般)
- 擬人化音声対話エージェントにおける発話時の頭部挙動モデル
- D-14-17 破裂子音の音響特徴に関する研究(D-14. 音声,一般セッション)
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- リアルな発話運動を実現する生理学的口唇力学モデルの構築(バイオサイバネティックス, ニューロコンピューティング)
- 模倣による調音ダイナミクスモデル制御の獲得(「脳・認知科学」及び一般)
- 音声生成における軟口蓋の働きのモデル化に関する研究(音声・聴覚,一般)
- 調音運動ダイナミクスの音声認識への応用(聴覚・音声/一般)
- 調音データに基づいた調音結合の分析
- 発話時舌内部変形のモデルシミュレーションとtagged-MRIによる観測との比較(合成, 生成, 韻律, 一般)
- 音声と一対多の関係にある調音状態の分布構造--発話機構モデルに基づく考察
- 新映像技術「ダイブイントゥザムービー」
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割(聴覚・音声/一般)
- 通常発話状態と特異発話状態との判別基準の検討(聴覚・音声/一般)
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割
- 通常発話状態と特異発話状態との判別基準の検討
- 日本語5母音の調音・音響的観測とモデルシミュレーションとの比較(音声・聴覚,一般)
- 生理学的発話機構モデルを用いた音響特性と発話状態の関連性の検討
- 生理学的な調音モデルを用いた調音結合のモデル化及びシミュレーション
- 音響パプメータと調音パラメータの結合を考慮した音声認識(聴覚・音声・言語とその障害)
- 加重等分解度特徴量を用いたテキスト独立型話者識別
- 新映像技術「ダイブイントゥザムービー」
- 発話運動における調音結合の分析について
- 加重等分解度特徴量を用いた話者識別
- 生理学的特徴量の話者識別における有効性についての検討
- 復唱による母音学習過程における音声知覚に関する考察
- MR画像に基づいた変形による生理学的発話機構モデルの個人化
- 2000-SLP-32-13 音声対話システムにおける擬人化エージェントの挙動の数理的モデル
- ディジタルオーディオにおける深い感性に関連した音質劣化の原因究明--jitterに起因する音質劣化の仕組みの解明と新改善方法の検討 (特集 感性ロボティクス)
- MR画像に基づいた変形による生理学的発話機構モデルの個人化(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
- D-14-13 雑音重畳音声の了解度における3次元映像提示の影響(D-14.音声)