音響調音対コードブックを用いた音声からの調音運動の逆推定
スポンサーリンク
概要
- 論文の詳細を見る
調音運動と音声の同時観測データに基づく音響調音対コードブックを用い,音声スペクトルから調音パラメータの推定する手法を提案する.本手法は,入力音声のスペクトルに対してスペクトルセグメントを単位としてスペクトル距離に基づく音響調音対コードブック検索を行い,距離の小さい順に音響コードベクトルと対をなす調音コードベクトルの候補を複数個選択する.次に,選択された調音コードベクトルの候補に対して,調音運動の連続性を考慮したパス探索を行うことにより最適な調音パラメータを決定する.この手法では,実測された調音データを用いることで調音に関する静的及び動的な制約を調音音響コードブックに内在させ,かつ調音運動の連続性に基づく解の探索を行うことにより,音声スペクトルから調音パラメータを推定する逆問題における解の冗長性を解消している.3名の話者が発声した文章音声について調音パラメータの推定値を実測値と比較した結果,平均2乗誤差は1.81mmであり,声道の閉鎖やせばめ等の子音の調音特徴が音声から良好に推定されることが示された.
- 社団法人電子情報通信学会の論文
- 2002-07-25
著者
-
鈴木 紳
Nttコミュニケーション科学基礎研究所:crest Jst
-
岡留 剛
NTTコミュニケーション科学基礎研究所
-
誉田 雅彰
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
岡留 剛
Nttコミュニケーション科学基礎研究所:crest Jst
-
誉田 雅彰
NTTコミュニケーション科学基礎研究所
-
誉田 雅彰
Nttコミュニケーション科学基礎研究所:crest Jst
関連論文
- 人間形発話ロボットによる人間の発話メカニズムの解明
- センサネットワークにおける接触関係を用いたルール記述手法の提案(UBI-2【ミドルウェア/スマートオブジェクト】)
- ユーザの嗜好に適応させた選曲システムの提案
- センサネットワークを用いた人間の作業効率の評価手法の考察(コンテキスト)
- 作業過程をセンシングするための作用素に基づくアノテーション実験(UBI4:コンテクストアウエア)
- 3次元人間形発話ロボットにおける共鳴特性の向上を目的とした声道機構の開発(合成,生成,韻律,一般)
- 人間に近い音声生成を目指した発話ロボットの開発
- 無声子音における舌・唇と喉頭の調音運動の時間関係の分析
- 無声子音における調音・声門運動のタイミングの分布 - 促音の有無による比較 -
- 可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定
- 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出
- 階層的センサネットワークのための効率的なデータ収集手法
- ウェアラブルセンサによるモノを用いた行動の認識について
- ウェアラブルセンサによるモノを用いた行動の認識について
- ウェアラブルセンサによるモノを用いた行動の認識について
- ウェアラブルセンサによるモノを用いた行動の認識について
- 座談会 : 音声研究を語る : (小特集:)
- 発話動作における時間軸修正量と補償動作の関係(聴覚・音声・言語とその障害,一般)
- 無声子音発声時の舌・喉頭運動における発声の強さの影響(聴覚,音声,言語とその障害)
- 無声子音の発話運動における発声の強さの影響の分析
- 音声生成における発話協調動作機構
- 促音が先行する無声子音の調音・声門運動タイミングの分析
- 口蓋形摂動に対する調音補償動作の分析
- 無声子音の生成における声門運動の時間パタンの分析
- 無声子音生成における調音器官と声門の運動タイミングの分析
- 音響調音対コードブックを用いた音声からの調音運動の逆推定
- 逐次連続動作の軌道の運動学的構成法
- NN順逆モデリングを用いた人間形発話ロボットの声帯振動制御
- 生理学的構造に基づく人間形発話ロボットの声帯機械モデル(機械力学,計測,自動制御)
- ロボットにおける発話(ロボットにおける音響技術)
- ユビキタスセンサを用いたライフログの蓄積と利用(セッション2)
- ウェアラブルセンサによるモノを用いた行動の認識について
- ウェアラブルセンサによるモノを用いた行動の認識について
- ウェアラブルセンサによるモノを用いた行動の認識について
- 低周波振動の伝播を利用した屋内での作業道具の位置検出手法
- 実世界イベント理解に向けた語彙集合の構築と評価
- センサネットワークのためのトポロジーの変化を考慮したデータ集約方式(セッション3:慶應義塾大学)
- 高密度なセンサネットワークにおけるデータ収集のための階層的クラスタリング手法の提案(企画:「シミュレーションと現実のギャップを埋められるのか?」,モバイルP2P,ユビキタスネットワーク,アドホックネットワーク,センサネットワーク,一般)
- BS-14-3 センサ情報からの実世界言語化・可視化・コンテンツ化(BS-14.ユビキタス・センサーネットワーク技術〜モノによるユビキタス環境を目指して〜,シンポジウムセッション)
- 振動波と加速度センサを用いた物体間の接触関係の取得手法(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 振動波と加速度センサを用いた物体間の接触関係の取得手法(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- センサデータ解釈のための拡張可能な知識構築手法(第3セッション)
- 大規模センサネットワークにおける遅延の抑制を考慮したデータ収集機構の提案(UBI-3【センサネットワーク/実世界センシング】)
- 大規模センサネットワークにおける遅延の抑制を考慮したデータ収集機構の提案(UBI-3【センサネットワーク/実世界センシング】)
- 人間形発話ロボットの3次元舌機構の構築
- 08測-2P-P29 色情報を用いたサッカー映像における選手の自動追跡(08.測定評価,一般研究発表抄録)
- 小型無線デバイスとセンサデータを用いた物体間の相対的な位置関係の推定
- 実世界指向コンテクストアウェアサービスの入力に着目した比較
- センサーネットワークの観測事象の特徴量に関する考察(センサネットワーク, 無線ネットワーク, ホームネットワーク, ヒューマンインタフェース, 情報家電, アクセシビリティ)
- センサーネットワークの観測事象の特徴量に関する考察
- 音声認識のためのダイナミック非線形手法
- センサネットワークにおける接触関係を用いたルール記述手法の提案(UBI-2【ミドルウェア/スマートオブジェクト】)
- ウェアラブルセンサによるモノを用いた行動の認識について
- 作業過程をセンシングするための作用素に基づくアノテーション実験(UBI4:コンテクストアウエア)
- K_005 ロボットの状況判断モデル構築のための人物動作分析(K分野:ヒューマンコミュニケーション&インタラクション)
- 調音音声符合帳探索を用いた調音パラメータの推定
- 調音音響対コードブックを用いた音声から調音運動の推定
- テキストから調音運動へ
- 調音音声同時観測データを用いた音声から調音運動の推定の検討
- 音素系列からの調音運動軌道の生成
- 3層ニューラルネットワークによる構成的関数近似とその飽和について
- 3層ニューラルネットワークによる関数近似の構成的理論と誤差評価について
- 平均曲率に基づいた神経回路網の評価基準
- センサネットワーク環境における実世界イベント検索システム(ユビキタスコンピューティング,マルチメディア,分散,協調とモバイル(DICOMO2006))
- ユビキタスコンピューティング環境におけるセンサデータを用いたモノの状態推定について(ユビキタス,夏のデータベースワークショップDBWS 2006)
- ユビキタスコンピューティング環境におけるセンサデータを用いたモノの状態推定について(ユビキタス)
- J_020 ディジタルアクタシステム実現のための感情表出モデルの構築(J分野:グラフィクス・画像)
- I_055 デジタルカメラワークによるサッカー映像生成(I分野:画像認識・メディア理解)
- Tag and Think: センサネットワークを前提としたモノ自身とその状態の推定(UBIセッション3)
- 音素列情報を加味した連続音声から調音運動の復元方法
- 調音運動から見たパラ言語情報の生成
- 多次元不変特徴タスクに基づく調音運動の軌道生成
- 多次元不変特徴タスクを用いた調音運動の軌道生成
- 科学技術振興事業団 戦略基礎研究推進事業(CREST) : 発声力学に基づくタスクプランニング機構の構築 : (小特集:)
- 人に迫る発話工学 : 人の発話をいかに観測し真似るか (話す仕組みを巡って : 発話機構研究の最前線)
- 磁界のパラメトリック表現を用いた磁気センサシステムの検討
- 人間形発話ロボットによる母音および子音発声の実現 : 第3報,より人間に近い発声を目指した新型発話ロボットの開発(機械力学,計測,自動制御)
- 音響特徴を用いた発話ロボットの声道形状の最適化
- 発話ロボットの弾性体柔軟舌形状のモデル化および音響モデルとの統合(機械力学,計測,自動制御)
- 人間形発話ロボット : 喉を震わせ口を動かして発話するロボット
- 統計的音声生成モデルに基づく任意話者の調音運動の逆推定(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
- 調音運動の逆推定における話者適応化法
- 統計的音声生成モデルに基づく調音運動の逆推定法
- 瞬時周波数アトラクタに基づく正弦波分析合成法
- HMMに基づく音声からの調音運動の逆推定
- 声を出す仕組み (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 発話機構の計算論的研究 (特集 人間の情報処理システム--言語と脳科学)
- 3次元磁気センサシステムにおける測定誤差要因に関する検討
- 磁界のスプライン表現を用いた3次元磁気センサシステムの検討
- 3次元磁気センサシステムの位置推定精度の検討
- neighborSense: 相対的な位置関係を用いた実世界の状況把握(センシングコンピューティング)
- センサネットワーク環境におけるモノ参加型Weblogの実現(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 磁気センサシステムの磁界表現における平滑化スプラインの利用
- 磁界のスプライン表現に基づいた磁気センサシステムの検討
- s-room: 実世界リアルタイムコンテンツ化 : モノとコトに関する情報の生成とそのコンテンツ化(ユビキタス・センサネットワークを支える理論,および一般)
- 損失声道モデルに基づく口唇インパルス応答からの声道断面積関数推定
- s-room--実世界情報の生成とそのリアルタイムコンテンツ化 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 日常物の利用情報を用いたコンテキストサーチ
- センサネットワーク環境におけるモノ参加型Weblogの実現(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- Tag and Think: センサネットワークを前提としたモノ自身とその状態の推定(UBIセッション3)