リカレントニューラルネットワークを用いた補間法とその音声符号化への応用
スポンサーリンク
概要
- 論文の詳細を見る
音声の低ひずみ, 低ビット符号化への応用を目的として, 時間変化パターンの記憶, 再生能力を有するリカレントニューラルネットワーク(RNN)を, 音声のスペクトルパターンの補間に用いる符号化方式を提案する. 提案するRNN補間器は多次元の時間変化パターンをその始端と終端の値のみから補間して復元する機能を有する. 本論文では, まずRNN補間器の学習方法として, 選択的通時的誤差逆伝播法(BPSS)を導く. これは通時的誤差逆伝播法(BPTT)をもとにした方法で一つのRNNが複数パターンの補間を可能にするものである. 次に, RNN補間器の能力を評価するため, 多項式から作成した時間変化パターンを被補間パターンとして用いた実験を行う. そして, 音声信号のLSP係数の符号化へRNN補間器を応用する具体的方法について述べ, シミュレーションにより符号化後の音声のスペクトルひずみを測定し, 他の補間法を用いた場合との比較を行う.
- 社団法人電子情報通信学会の論文
- 1996-05-25
著者
関連論文
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化(音声,聴覚)
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビット化(言語獲得・学習,合成,生成,韻律,一般)
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化
- 木構造HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- Ergodic HMMを用いた音声符号化に関する検討
- 聴覚特性を利用した正弦波重畳による低ビット音声符号化
- 聴覚特性を利用した正弦波重畳による低ビット音声符号化
- 聴感特性を用いた連続正弦波(CSW)モデルによる音声符号化
- 伝送誤りにロバストな音声符号化方式に関する一検討
- 多重M系列を用いた通信イミュニティテスト用ランダムパルス列(RPS)発生器の統計検定
- 1.ケータイの昨今(ケータイの科学)
- Lempel-Ziv符号化を用いたLSP係数のセグメント量子化(音声,聴覚)
- Lempel-Ziv符号化を用いたLSP係数のセグメント量子化(聴覚・音声及び一般)
- KL展開を用いたオーディオ信号の次元圧縮に関する検討
- LZ符号化を利用した音声符号化
- LZ符号化を利用した音声符号化
- 自己相似性を用いたセグメント量子化による音声符号化
- LZ符号化方式を用いた音声符号化に関する検討
- LZ符号化方式を用いた音源情報符号化に関する検討
- 自己相似性を用いたLSP係数のセグメント量子化
- 正弦波重畳型ボコーダによる1.2kbit/s音声符号化方式
- リカレントニューラルネットワークを用いた補間法とその音声符号化への応用
- RNN補間器を用いたLSP係数の符号化
- リカレントニューラルネットワーク補間器を用いたLSP係数の符号化
- リカレントニューラルネットワークを用いたLSP係数の補間
- 複数のリファレンスパターンを使用するJoint Transform Correlatorとその文字認識への応用
- MRPJTC(Multi-Reference Pattern Joint Transform Correlator)を用いた光学的文字認識に関する一実験
- 1-18 並列光演算に関する実験的検討
- リカレントニューラルネットワークを用いた音声信号の時間変化パタンの符号化
- 21-8 ニューラルネットを用いた音声信号の時間変化パターンの符号化に関する一検討
- RNN補間器による音声スペクトルパタンの符号化
- 超円柱クラスタによるベクトル量子化
- フーリエ変換を用いた光学的加減算とそのベクトル間距離計算への応用に関する基礎実験
- 音声合成を用いた秘話通信方式(画質・音質評価,知覚・認知メトリクス,人間視聴覚システム,一般)