Design of a Robust LSP Quantizer for a High-Quality 4-kbit/s CELP Speech Coder(Speech and Hearing)
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents an efficient LSP quantizer implementation for low bit-rate coders. The major feature of the quantizer is that it uses a truncated cepstral distance criterion for the code selection procedure. This approach has generally been considered too computationally costly. We utilized the quantizer with a moving-average predictor, two-stage-split vector quantizer and delayed decision. We have investigated the optimal parameter settings in this case and incorporated the quantizer thus obtained into an ITU-T 4-kbit/s speech coding candidate algorithm with a bit budget of 21 bits. The objective performance is better than that with a conventional weighted mean-square criterion, while the complexity is still kept to a reasonable level. The paper also describes the codebook design and techniques that were employed to achieve robustness in noisy channel conditions.
- 社団法人電子情報通信学会の論文
- 2004-06-01
著者
-
間野 一則
Nttサイバースペース研究所
-
間野 一則
Nttサイバースペース研
-
Ehara Hiroyuki
Next-generation Mobile Communications Development Center Matsushita Electric Industrial Co. Ltd.
-
Yasunaga Kazutoshi
Broadband Communications Development Center Matsushita Electric Industrial Co. Ltd.
-
Kaneko T
Redox Regulation Research Group Tokyo Metropolitan Institute Of Gerontology
-
KANEKO Takao
NTT Cyber Space Laboratories NTT Corporation
-
HIWASAKI Yusuke
NTT Cyber Space Laboratories, NTT Corporation
-
Yoshida K
Broadband Communications Development Center Matsushita Electric Industrial Co. Ltd.
-
MANO Kazunori
NTT Cyber Space Laboratories, NTT Corporation
-
MORII Toshiyuki
AV Core Technology Development Center, Matsushita Electric Industrial Co., Ltd.
-
Morii T
Av Core Technology Development Center Matsushita Electric Industrial Co. Ltd.
-
Mano Kazunori
Ntt Cyber Space Laboratories Ntt Corporation
-
間野 一則
芝浦工業大学システム理工学部
-
Kaneko Takao
Ntt Cyber Space Laboratories
-
Hiwasaki Yusuke
Ntt Cyber Space Laboratories Ntt Corporation
-
MORII Toshiyuki
Faculty of Human Development, Division of Sciences for Natural Environment : Graduate School of Science and Technology Kobe University
-
MORII Toshiyuki
Graduate School of Science and Technology and College of Liberal Arts Kobe University
-
MORII Toshiyuki
Graduate School of Science and Technology and Faculty Human Development, Kobe University
関連論文
- 4-kbit /s Multi-Dispersed-Pulse-Based CELP (MDP-CELP) Speech Coder
- SG会合報告 ITU-T SG16(マルチメディアサービス、システムおよび端末)第8回全体会合報告
- SG会合報告 ITU-T SG16(マルチメディアサービスとシステム)第6回全体会合報告
- 2. 音声符号化技術 (<特集>「音声処理技術とその応用」)
- CELP 符号化における励振符号帳の学習法
- ピッチ同期雑音励振源をもつ CELP 符号化 (PSI-CELP)
- 移動平均型フレーム間予測を用いる LSP パラメータのベクトル量子化
- D-14-3 ITU-T標準化向け24,32kbit/s広帯域コーデックの検討
- メディア処理(メディア情報,映像情報メディア年報)
- マルチメディア情報処理(画像情報工学)(映像情報メディア年報)
- インパルス応答の極端な打ち切りによる4.6kbit/s低演算量音声符号化
- 顧客へのリアルな音声応答を実現するテキスト音声合成技術「Cralinet」 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- 波形接続型音声合成のためのアクセント評価に基づく素片再選択法(合成,生成,韻律,一般)
- 音声符号化のテクニック
- D-14-18 ForwarD-Backward Recover Sub-Codec(FB-RSC)に基づくパケット消失補償
- D-14-24 定常雑音生成器に基づく雑音後処理
- D-14-23 高能率MA予測LSPパラメータ量子化の検討
- ピッチ波形に基づく線形予測ボコーダ
- ITU-Tにおける音声符号化の標準化動向
- ピッチ波形に基づく低ビットレート音声符号化法における励振源に関する検討
- ピッチ波形に基づく2kbit/s音声符号化法
- スパース符号帳を用いたPSI-CELP音声符号化
- A G.711 Embedded Wideband Speech Coding for VoIP Conferences(Speech and Hearing)
- 高品質音声圧縮技術を用いた視覚障害者のための朗読配信システム
- DualSpeechの応用ソフトウェア:DualSpeech/DATA,DualSpeech/MAIL (特集論文 音声圧縮ソフトDualSpeechとその応用)
- 5kHz帯域低ビットレート音声符号化 : 帯域感, ノイズ感と主観品質の関係(音声情報処理 : 現状と将来技術論文特集)
- 高速パルス探索型4kbit/s音声符号化
- 低ビットレート音声符号化における背景雑音付加音声の品質向上
- 低ビットレート音声符号化における背景雑音付加音声の品質向上
- 雑音下での音声符号化 -実用における課題-
- DualSpeech音声符号化ソフトウェア (特集論文 音声圧縮ソフトDualSpeechとその応用)
- 木符号化を用いたディレ-ドデシジョンCELP符号化
- Is There Window for a "Supersoft" Pomeron in J/ψ Photoproduction at Low Energy?
- Reflection of Light Caused by Sharp Bends in Optical Fiber
- PSI-CELPの主観品質向上技術と評価結果 (移動通信用PSI-CELP音声符号化方式)
- Spontaneous dwarf rat : A novel model for aging research
- Quality Evaluation and Improvement of MPEG-4 TwinVQ Scalable Audio Coding under Packet Loss Condition
- Lossless Scalable Audio Coding and Quality Enhancement (Special Issue on Speech Information Processing)
- 音声の高能率符号化 (音声信号処理特集号)
- Measuring the Perceived Importance of Speech Segments for Transmission over IP Networks( Multimedia QoS Evaluation and Management Technologies)
- Noise Post-Processing for Low Bit-Rate CELP Coders(Speech and Hearing)
- Design of a Robust LSP Quantizer for a High-Quality 4-kbit/s CELP Speech Coder(Speech and Hearing)
- Age-related increase of reactive oxygen generation in the brains of mammals and birds : Is reactive oxygen a signaling molecule to determine the aging process and life span?
- A Remote Auscultation Support System Using Network
- Comparison of Two Speech and Audio Coders at 8 kb/s from the Viewpoints of Coding Scheme and Quality (Special Issue on Performance and Quality of Service (QoS) of Multimedia Networks
- K-Meson Spectroscopy in the Static Limit of s-Quark : Particles and Fields
- Semileptonic Decays of Atomlike Hadrons in the Heavy Quark Effective Theory : Particles and Fields
- Coding of LSP Parameters Using Interframe Moving Average Prediction and Multi-Stage Vector Quantization (Special Section of Letters Selected from the 1993 IEICE Spring Conference)
- Pitch Synchronous Innovation CELP (PSI-CELP) (Special Section of Letters Selected from the 1993 IEICE Spring Conference)
- A Modified Cascade Model for Hadron-Nucleus Collisions at High Energies(Hadron-Nucleus Collisions,Proceedings of the Multiparticle Dynamics)
- A Modified Cascade Model for Hadron-Nucleus Collisions at High Energies
- Structure of Hadron-Hadron Collision at High Energies and a New Integral Equation for Production Amplitudes
- Particle Correlations in an Independent Emission Model
- Structure of Inner Couplings in Exclusive Reactions
- 音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- Special Invited Survey and Special Issue on the 2001 IEICE Excellent Paper Award
- Analog Standard Cells for A-D and D-A Converters with Δ-Σ Modulators(Special Section on Analog Circuit Techniques and Related Topics)
- 低ビットレ-トの音声符号化インタ-ネットでも適用始まる
- ベクトル量子化スペクトルの頻度分布による話者識別
- フレ-ム単位の特徴系列による音韻性情報の抽出
- フレ-ム単位の特徴系列による音韻性情報の抽出
- The Spin-Dependent Gluon Distribution in a Proton
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
- D-14-7 発話ログ分析におけるシーン推定のための特徴量抽出(D-14.音声,一般セッション)
- Is There Window for a"Supersoft"Pomeron in J/ψ Photoproduction at Low Energy?
- K-Meson Spectroscopy in the Static Limit of s-Quark
- Semileptonic Decays of Atomlike Hadrons in the Heavy Quark Effective Theory
- セグメンタルNMFによる音声分析合成における基底行列圧縮の検討
- 2-222 グローバルPBLのアウトカムとアセスメント(オーガナイズドセッション:プロジェクトマネジメントとPBL-II)
- 2-221 システム思考の工学に基づいた国際+世代+領域間混成によるGlobal Project Based Learning(オーガナイズドセッション:プロジェクトマネジメントとPBL-II)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)
- PCM量子化雑音低減のための事例ベース音声強調(スピーチエンハンスメント,電気音響,信号処理,音声一般)