音素別ニューラルネットワークを用いた調音-音響マッピング(信号処理・符号化・一般)
スポンサーリンク
概要
- 論文の詳細を見る
本論では,連続発声時の唇,顎,舌,軟口蓋といった調音器官の運動軌道と,発話内容を表す音素情報が与えられたときに,これに対応する声道スペクトル特性を推定する方法について述べる.ここでは,調音器官の位置パラメータから声道スペクトル特性へのマッピングを行うために,音素別に構成されたニューラルネットワークを用いる.調音位置と音素環境が与えられたとき,該当する音素別のニューラルネットワークに調音位置を入力することで,音素環境に依存したスペクトルが得られる.得られたスペクトルを調音次元での距離に基づいて補間することにより,最終的な声道スペクトル特性が推定される.本手法を用いて連続発声時のスペクトル推定実験を行った結果,スペクトル歪は3.58dBとなり,音素情報を用いない単一のニューラルネットによる推定を行った場合と比べ,約0.57dBの改善が得られることが明らかとなった.
- 社団法人電子情報通信学会の論文
- 2003-09-23
著者
-
鏑木 時彦
九州大学大学院芸術工学研究院
-
若宮 幸平
九州大学大学院芸術工学研究院
-
鏑木 時彦
九州芸術工科大学芸術工学部音響設計学科
-
若宮 幸平
九州芸術工科大学
-
辻 拓哉
パイオニア
-
辻 拓哉
九州芸術工科大学
-
金 智之
九州芸術工科大学
-
金 智之
九州大学
-
鏑木 時彦
九州芸術工科大学
関連論文
- 発声における音源 : フィルタ相互作用の周波数依存性について(音声・言語・音響教育,一般)
- 高校生のための音響サイエンスキャンプ : 先進的科学技術体験合宿プログラムによる音響入門講座(音声・言語・音響教育,一般)
- 無声子音における舌・唇と喉頭の調音運動の時間関係の分析
- 無声子音における調音・声門運動のタイミングの分布 - 促音の有無による比較 -
- 促音が先行する無声子音の調音・声門運動タイミングの分析
- 口蓋形摂動に対する調音補償動作の分析
- 無声子音の生成における声門運動の時間パタンの分析
- 無声子音生成における調音器官と声門の運動タイミングの分析
- 磁気センサシステムおよびフォトグロットグラフを用いた調音器官と声門の運動観測
- 実測孤立再生波形を用いた高密度再生波形の推定限界
- 実測孤立再生波形を用いた高密度再生波形の推定限界
- 狭トラック記録におけるヘッドフリンジ磁界の影響
- 薄膜ディスク記録特性に及ぼすヘッドエッジ磁界の影響
- 薄膜ディスクにおける記録・再生にじみ
- 薄膜ディスクにおける記録・再生にじみ
- トランペット奏者の声道の音響的役割について(音楽・歌声,合成,生成,韻律,音声一般)
- 調音音声符合帳探索を用いた調音パラメータの推定
- 調音音響対コードブックを用いた音声から調音運動の推定
- テキストから調音運動へ
- 調音音声同時観測データを用いた音声から調音運動の推定の検討
- 音素系列からの調音運動軌道の生成
- 音素ラベル付き調音・音響対コードブックの検索に基づく調音運動からの音声合成法の検討
- 音素ラベル付き調音・音響対コードブック検索を用いた調音運動からの音声合成法の検討
- 薄膜ディスクにおける記録・再生にじみに関する検討
- 境界層近似による声門流解析 : 1次元と2次元の場合の比較(合成,生成,韻律,一般)
- 声門流における流れの剥離の影響に関する検討
- 声門流における境界層特性量の推定
- 境界層近似による声門流の剥離位置推定(合成, 生成, 韻律, 一般)
- 渦法と等角写像を用いた2次元声門流のモデル表現(聴覚・音声・言語とその障害)
- 等角写像を用いた2次元声門流の解析(信号処理・符号化・一般)
- 等角写像を用いた2次元声門流の解析(信号処理・符号化・一般)
- 音素別ニューラルネットワークを用いた調音-音響マッピング : パラメータ学習法の検討(福祉と音声処理及び一般)
- 音素別ニューラルネットワークを用いた調音-音響マッピング : パラメータ学習法の検討(福祉と音声処理及び一般)
- 音素別ニューラルネットワークを用いた調音-音響マッピング(信号処理・符号化・一般)
- 音素別ニューラルネットワークを用いた調音-音響マッピング(信号処理・符号化・一般)
- 音素列情報を加味した連続音声から調音運動の復元方法
- 調音運動から見たパラ言語情報の生成
- 多次元不変特徴タスクに基づく調音運動の軌道生成
- 多次元不変特徴タスクを用いた調音運動の軌道生成
- 連続発声における発声速度と調音運動との関係
- 磁界のパラメトリック表現を用いた磁気センサシステムの検討
- (1,7)RLL符号に対するPRML方式のSN比改善
- (1,7)RLL符号に対するPRML方式の誤り率特性改善
- 4)非線形歪を伴うPRMLチャネルのためのニューラルネットワーク等化の簡単化(画像情報記録研究会)
- 非線形歪を伴うPRMLチャネルのためのニューラルネットワーク等化の簡単化
- 非線形歪を伴うPRMLチャネルのためのニューラルネットワーク等化の簡単化
- 5)パス帰還ビタビ復号法による誤り率特性改善の一検討(画像情報記録研究会)
- MRヘッド非線形歪を伴うPRMLチャネルのニューラルネットワーク等化の一検討
- 高密度記録における非線形歪のニューラルネットワーク等化
- MRヘッド非線形歪に対するニューラルネットワーク等化の一検討
- 26-5 ニューラルネットワーク等化によるPRML方式の一検討
- パーシャルイレージャを伴うPRMLチャネルのニューラルネットワーク等化
- パーシャルイレージャを伴うPRMLチャネルのニューラルネットワーク等化
- パーシャルイレージャを伴う非線形チャネルのニューラルネットワーク等化の一検討
- 3次元磁気センサシステムの評価(合成, 生成, 韻律, 一般)
- 声門流解析と音源-フィルタ相互作用を考慮した発声モデル(言語獲得・学習,合成,生成,韻律,一般)
- ディジタル磁気記録におけるパス帰還ビタビ複合法の誤り率特性
- パス帰還ビタビ復号法による誤り率特性改善の一検討
- パス帰還ビタビ復号法による誤り率特性改善の一検討
- 粒子法による声帯の連続体モデル(合成,生成,韻律,一般)
- 調音運動モデルを用いた声道スペクトルの生成(福祉と音声処理及び一般)
- 調音運動モデルを用いた声道スペクトルの生成(福祉と音声処理及び一般)
- 3次元磁気センサシステムにおける測定誤差要因に関する検討
- 磁界のスプライン表現を用いた3次元磁気センサシステムの検討
- 3次元磁気センサシステムの位置推定精度の検討
- 磁気センサシステムの磁界表現における平滑化スプラインの利用
- 磁界のスプライン表現に基づいた磁気センサシステムの検討
- 重ね合わせモデルを用いた有声音源特性の分析法の検討
- 音源・声道モデルを用いた音声分析法に関する検討
- 音源・声道モデルを用いた音声分析法に関する検討
- 音素ラベル付き調音・音響対コードブックを用いた調音運動からの音声合成法の検討
- コードブックアプローチに基づく調音・音響マッピングの検討
- 磁気センサシステムの校正法の検討
- 磁気位置検出装置のキャリブレーション法の検討
- 調音運動生成モデルにおけるタスク独立な運動規範の検討
- 調音運動に基づく連続音声の生成モデル
- 声道形状の特徴をタスクに用いる調音運動の軌道生成モデル
- 磁界のスプライン表現に基づく3次元磁気センサシステム
- 自由発話における音声情報生成過程の解析
- 日本語,中国語,朝鮮語における破裂子音生成の特徴分析
- 調音データを用いた声道断面積関数の制御に関する検討(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
- 声区転換における音源-フィルタ相互作用の効果について(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
- 感度関数を用いたフォルマント周波数から声道形状への逆推定法の検討(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
- 音響感度関数を用いたホルマントからの声道長および声道断面積の推定に関する検討 (音声)
- 感度関数を用いたフォルマント周波数から声道形状への逆推定法の検討
- 声区転換における音源-フィルタ相互作用の効果について
- 音響感度関数を用いたホルマントからの声道長および声道断面積の推定に関する検討(一般セッション,福祉と音声処理,一般)