雑音下音声LSPパラメータ量子化ニューラルネットにおける中間層符号パターンと量子化歪の関連
スポンサーリンク
概要
- 論文の詳細を見る
移動体通信では,限られた周波数帯域を有効利用するために個々の通信機器の占有周波数帯域を狭くすることが求められている.そのためには,背景雑音に強い音声の高能率符号化が必要である.我々は音声特微量の一つであるLSPを符号化する際,背景雑音に強い符号化法としてニューラルネットワークを用いたベクトル量子化(NNVQ)を検討する.本論文では,四種類の中間層符号パターンを用いた場合の量子化ひずみの比較を行い,ニューラルネットワークの学習との間の関連を明らかにする.更に符号化を行う際, EbD法により復号化のひずみを小さくするような符号を選ぶことにより, LSP誤差を最大0.007(21%)低減でき,全体として雑音入り音声に対してはVQ法よりも性能が良くなることを示す.また,符号化と復号化のニューラルネットワークを結合し,再度学習する方法でもLSP誤差を最大0.020(43%)低減できることを示す.最後に,学習時と異なるSNR音声に対するLSP誤差を調べ,背景雑音が存在する場合の学習について検討し,SNR30〜40dBでの学習が適切になることを示す.
- 2003-07-17
著者
関連論文
- 雑音下音声LSPパラメータ量子化ニューラルネットにおける中間層符号パターンと量子化歪の関連
- 雑音下音声認識のための重み付け分散拡大に基づく単語HMMの耐雑音性の改善(音声,聴覚)
- 有声音検出に基づくロンバード音声認識と工場における検反システムへの応用
- 音声認識における単語HMMの重み付け分散拡大による耐雑音性の検討
- 単語HMMの重み付け分散拡大による雑音環境下音声認識
- 粘弾性体による声帯音源の構築
- BPF対バンクによる耐雑音性をもった音声特徴抽出
- 単語音声認識における時間変化を表現する特徴量の耐雑音性について(聴覚・音声/一般)
- D-14-18 スペクトル傾斜検出フィルタによる音声認識とその耐雑音性の検討
- スペクトル傾斜検出フィルタを用いた単語音声認識
- 独立成分分析を用いた音声による講義ビデオシーン分割
- 仮想的な石川高専 -三次元画像の制作-
- Kohonen特徴地図を利用した単語音声認識のためのHMM出力確率の平滑化
- BPFPとNNを用いた雑音環境下でのピッチ抽出性能の評価
- BPFPとNNを用いたピッチ周期性検出法の優位性の検討
- ピッチ乱れ,波形変動及び雑音付加に対するBPFPピッチ抽出法の性能評価
- BPFP 法による音声特徴量の耐雑音性向上に関する検討
- HMM出力確率の共分散行列に対する制約条件の実験的考察
- フィードバック付き多層相互結合形NNによる音声ピッチ抽出およびU/V判定
- ピッチ抽出NNにおけるフィードバックおよび層内相互結合の効果の検討
- フィードバック付き多層相互結合型NNによる音声ピッチ抽出およびU/V判定
- 超音波スピーカーの歪について
- 不整脈を起す心筋興奮異常伝導路を正確かつ迅速に発見する
- ディジタルフィルタによる非定常過程周波数分布の特徴抽出について
- 非対称声帯モデルによる疾患音声生成の数値シミュレーション(聴覚・音声/一般)
- 音声認識のための特徴量FTTSSの電話音声認識への適用について(聴覚・音声/一般)
- スペクトル傾斜に基づく特徴量の音素モデルによる単語音声認識への適用
- 階層型ネットワークによる音声LSPパラメータのベクトル量子化
- 単語音声認識におけるHMM出力確率の共分散行列に対する制約条件の実験的考察
- KNT法によるニュ-ラルネットワ-クの学習とベクトル量子化への応用
- 音声変換のための逐次処理による音源波形作成法
- 単音節波形の連接による日本語単語音声合成
- 単音節波形の連接による日本語単語音声合成
- スペクトル傾斜に着目した音声認識のための特徴抽出
- BPFPメルケプストラム の音声認識における耐雑音性の検討
- スペクトル傾斜に着目した音声の特徴抽出
- エルゴディック離散/連続HMMを用いた単語境界の抽出
- カルマンニューロ法によるLSPパラメータのベクトル量子化
- カルマン・ニューロ法によるLSPパラメータの量子化
- 3層NNによるLSPパラメータのベクトル量子化と聴取実験による検討
- 実環境下単語音声区間検出のための雑音EHMM再学習の効果
- 実環境下単語音声区間検出のための雑音EHMM再学習の効果
- LSPパラメータの雑音低減 : ニューラルネットワークとK-L変換の比較
- LSPパラメータの雑音低減 : ニューラルネットワークとK-L変換の比較
- KNT法によるLSPパラメータのベクトル量子化と聴取実験による検討
- 電気的喉頭波形を用いた連続音声の 有声/無声/混合 分類
- 未知入力を伴うARモデルの逐次処理方式による音声分析合成
- 推定された声帯音源波の個人性評価と類似性判断