Noise Post-Processing for Low Bit-Rate CELP Coders(Speech and Hearing)
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents a newly developed noise postprocessing (NPP) algorithm and the results of several tests demonstrating its subjective performance. This NPP algorithm is designed to improve the subjective performance of low bit-rate code excited linear prediction (CELP) decoding under background noise conditions. The NPP algorithm is based on a stationary noise generator and improves the subjective quality of noisy signal input. A backward adaptive detector defines noisy input signal frames from decoded LSF, energy, and pitch parameters. The noise generator estimates and produces stationary noise signals using past line spectral frequency (LSF) and energy parameters. The stationary noise generator has a frame erasure concealment (FEC) scheme designed for stationary noise signals and therefore improves the speech decoder's robustness for frame erasure under background noise conditions. The algorithm has been applied to the following CELP decoders: 1) a candidate algorithm of the ITU-T 4-kbit/s speech coding standard and 2) existing ITU-T standards, the G.729 and G.723.1 series. In both cases, NPP improved the subjective performance of the baseline decoders. Improvements of approximately 0.25 CMOS (CCR MOS: comparison category rating mean opinion score) and around 0.2-0.8 DMOS (DCR MOS: degradation category rating mean opinion score) were demonstrated in the results of our subjective tests when applied to the 4-kbit/s decoder and G.729/G.723.1 decoders respectively. Other test results show that NPP improves the subjective performance of a G.729 decoder by around 0.45 in DMOS under both error-free and frame-erasure conditions, and a further improvement of around 0.2 DMOS is achieved by the FEC scheme in the noise generator.
- 社団法人電子情報通信学会の論文
- 2004-06-01
著者
-
間野 一則
Nttサイバースペース研究所
-
間野 一則
Nttサイバースペース研
-
Ehara Hiroyuki
Next-generation Mobile Communications Development Center Matsushita Electric Industrial Co. Ltd.
-
Yasunaga Kazutoshi
Broadband Communications Development Center Matsushita Electric Industrial Co. Ltd.
-
Kaneko T
Redox Regulation Research Group Tokyo Metropolitan Institute Of Gerontology
-
KANEKO Takao
NTT Cyber Space Laboratories NTT Corporation
-
HIWASAKI Yusuke
NTT Cyber Space Laboratories, NTT Corporation
-
Yoshida K
Broadband Communications Development Center Matsushita Electric Industrial Co. Ltd.
-
YOSHIDA Koji
Next-Generation Mobile Communications Development Center, Matsushita Electric Industrial Co., Ltd.
-
MANO Kazunori
NTT Cyber Space Laboratories, NTT Corporation
-
Mano Kazunori
Ntt Cyber Space Laboratories Ntt Corporation
-
間野 一則
芝浦工業大学システム理工学部
-
Kaneko Takao
Ntt Cyber Space Laboratories
-
Hiwasaki Yusuke
Ntt Cyber Space Laboratories Ntt Corporation
関連論文
- 4-kbit /s Multi-Dispersed-Pulse-Based CELP (MDP-CELP) Speech Coder
- SG会合報告 ITU-T SG16(マルチメディアサービス、システムおよび端末)第8回全体会合報告
- SG会合報告 ITU-T SG16(マルチメディアサービスとシステム)第6回全体会合報告
- 2. 音声符号化技術 (<特集>「音声処理技術とその応用」)
- CELP 符号化における励振符号帳の学習法
- ピッチ同期雑音励振源をもつ CELP 符号化 (PSI-CELP)
- 移動平均型フレーム間予測を用いる LSP パラメータのベクトル量子化
- D-14-3 ITU-T標準化向け24,32kbit/s広帯域コーデックの検討
- メディア処理(メディア情報,映像情報メディア年報)
- マルチメディア情報処理(画像情報工学)(映像情報メディア年報)
- インパルス応答の極端な打ち切りによる4.6kbit/s低演算量音声符号化
- 顧客へのリアルな音声応答を実現するテキスト音声合成技術「Cralinet」 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- 波形接続型音声合成のためのアクセント評価に基づく素片再選択法(合成,生成,韻律,一般)
- 音声符号化のテクニック
- D-14-18 ForwarD-Backward Recover Sub-Codec(FB-RSC)に基づくパケット消失補償
- D-14-24 定常雑音生成器に基づく雑音後処理
- D-14-23 高能率MA予測LSPパラメータ量子化の検討
- ピッチ波形に基づく線形予測ボコーダ
- ITU-Tにおける音声符号化の標準化動向
- ピッチ波形に基づく低ビットレート音声符号化法における励振源に関する検討
- ピッチ波形に基づく2kbit/s音声符号化法
- スパース符号帳を用いたPSI-CELP音声符号化
- A G.711 Embedded Wideband Speech Coding for VoIP Conferences(Speech and Hearing)
- 高品質音声圧縮技術を用いた視覚障害者のための朗読配信システム
- DualSpeechの応用ソフトウェア:DualSpeech/DATA,DualSpeech/MAIL (特集論文 音声圧縮ソフトDualSpeechとその応用)
- 5kHz帯域低ビットレート音声符号化 : 帯域感, ノイズ感と主観品質の関係(音声情報処理 : 現状と将来技術論文特集)
- 高速パルス探索型4kbit/s音声符号化
- 低ビットレート音声符号化における背景雑音付加音声の品質向上
- 低ビットレート音声符号化における背景雑音付加音声の品質向上
- 雑音下での音声符号化 -実用における課題-
- DualSpeech音声符号化ソフトウェア (特集論文 音声圧縮ソフトDualSpeechとその応用)
- 木符号化を用いたディレ-ドデシジョンCELP符号化
- Reflection of Light Caused by Sharp Bends in Optical Fiber
- PSI-CELPの主観品質向上技術と評価結果 (移動通信用PSI-CELP音声符号化方式)
- Spontaneous dwarf rat : A novel model for aging research
- Quality Evaluation and Improvement of MPEG-4 TwinVQ Scalable Audio Coding under Packet Loss Condition
- Lossless Scalable Audio Coding and Quality Enhancement (Special Issue on Speech Information Processing)
- 音声の高能率符号化 (音声信号処理特集号)
- Measuring the Perceived Importance of Speech Segments for Transmission over IP Networks( Multimedia QoS Evaluation and Management Technologies)
- Noise Post-Processing for Low Bit-Rate CELP Coders(Speech and Hearing)
- Design of a Robust LSP Quantizer for a High-Quality 4-kbit/s CELP Speech Coder(Speech and Hearing)
- Age-related increase of reactive oxygen generation in the brains of mammals and birds : Is reactive oxygen a signaling molecule to determine the aging process and life span?
- A Remote Auscultation Support System Using Network
- Comparison of Two Speech and Audio Coders at 8 kb/s from the Viewpoints of Coding Scheme and Quality (Special Issue on Performance and Quality of Service (QoS) of Multimedia Networks
- Coding of LSP Parameters Using Interframe Moving Average Prediction and Multi-Stage Vector Quantization (Special Section of Letters Selected from the 1993 IEICE Spring Conference)
- Pitch Synchronous Innovation CELP (PSI-CELP) (Special Section of Letters Selected from the 1993 IEICE Spring Conference)
- 音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- Special Invited Survey and Special Issue on the 2001 IEICE Excellent Paper Award
- Analog Standard Cells for A-D and D-A Converters with Δ-Σ Modulators(Special Section on Analog Circuit Techniques and Related Topics)
- 低ビットレ-トの音声符号化インタ-ネットでも適用始まる
- ベクトル量子化スペクトルの頻度分布による話者識別
- フレ-ム単位の特徴系列による音韻性情報の抽出
- フレ-ム単位の特徴系列による音韻性情報の抽出
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
- D-14-7 発話ログ分析におけるシーン推定のための特徴量抽出(D-14.音声,一般セッション)
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討
- 2-222 グローバルPBLのアウトカムとアセスメント(オーガナイズドセッション:プロジェクトマネジメントとPBL-II)
- 2-221 システム思考の工学に基づいた国際+世代+領域間混成によるGlobal Project Based Learning(オーガナイズドセッション:プロジェクトマネジメントとPBL-II)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)