正弦波重畳型ボコーダによる1.2kbit/s音声符号化方式
スポンサーリンク
概要
- 論文の詳細を見る
近年の音声符号化における低ビット化技術の動向として, ボコーダをべースとしてその音質を改善することにより極低ビット化と高音質を実現する方式がいくつか提案されている. これは, 従来のCELP系の符号化における低ビット化が限界に達していることによる. そこで, 本論文ではボコーダ型の1.2kbit/s極低ビット音声符号化方式を新たに提案する. 提案方式はLPCボコーダと同程度の情報を用いながら, その音質を良好なものとするために, 音声信号をピッチ周波数の整数倍の周波数を有する正弦波によって合成する, いわゆるHarmonic codingの手法を採用し, その振幅成分を聴覚フィルタを用いて適応的に変調する. 本論文ではまず正弦波による音声合成の原理について述べ, 次に聴覚フィルタの一つであるGammatoneフィルタを用いて正弦波を変調する方法について述べる. また, ビットレートを1.2kbit/sに削減するためにスペクトル情報(LSP係数)をDPマッチングを用いてセグメント量子化する方法も提案する. 符号化音声の音質評価のために主観評価実験を行った結果, 提案方法による合成音声の音質は, 1.2kbit/sのLPCボコーダのそれと比較してプリファレンススコアで37.5%, MOS値で0.45改善され, また2.4kbit/sのMELP方式と比較して同程度の主観的音質が得られることが確認された.
- 社団法人電子情報通信学会の論文
- 1999-03-25
著者
関連論文
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化(音声,聴覚)
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビット化(言語獲得・学習,合成,生成,韻律,一般)
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化
- 振動デバイスを用いた聴覚障害者用リアルタイム発話訓練システムの開発
- 木構造HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- セグメント末端処理を用いたErgodic HMMによるLSP係数の符号化
- Ergodic HMMを用いた音声符号化に関する検討
- 聴覚特性を利用した正弦波重畳による低ビット音声符号化
- 聴覚特性を利用した正弦波重畳による低ビット音声符号化
- 聴感特性を用いた連続正弦波(CSW)モデルによる音声符号化
- DPLLを用いた基本周波数抽出に関する検討
- 連続正弦波(CSW)モデルによる線形予測残差信号の表現に関する一検討
- WI処理による残差信号の圧縮に関する一検討
- 1.ケータイの昨今(ケータイの科学)
- Lempel-Ziv符号化を用いたLSP係数のセグメント量子化(音声,聴覚)
- Lempel-Ziv符号化を用いたLSP係数のセグメント量子化(聴覚・音声及び一般)
- KL展開を用いたオーディオ信号の次元圧縮に関する検討
- LZ符号化を利用した音声符号化
- LZ符号化を利用した音声符号化
- 自己相似性を用いたセグメント量子化による音声符号化
- LZ符号化方式を用いた音声符号化に関する検討
- LZ符号化方式を用いた音源情報符号化に関する検討
- 自己相似性を用いたLSP係数のセグメント量子化
- 正弦波重畳型ボコーダによる1.2kbit/s音声符号化方式
- リカレントニューラルネットワークを用いた補間法とその音声符号化への応用
- RNN補間器を用いたLSP係数の符号化
- リカレントニューラルネットワーク補間器を用いたLSP係数の符号化
- リカレントニューラルネットワークを用いたLSP係数の補間
- 聴覚障害者用発話訓練システム
- Q&Aコーナー(コーヒーブレーク)
- 有声/無声 情報を利用したLSP係数のLZ符号化
- 編集にあたって(ケータイの科学)
- パーソナルコンピュータを用いたリアルタイム発話訓練装置
- 聴覚特性を用いた1.2kbps音声符号化
- 音声合成を用いた秘話通信方式(画質・音質評価,知覚・認知メトリクス,人間視聴覚システム,一般)