2次元ケプストラムを利用する音声の有声-無声-無音クラス化
スポンサーリンク
概要
- 論文の詳細を見る
音声認識の前処理に必要なセグメンテーションや,ピッチ抽出などの音声分析における重要な問題の一つは,音声の各分析区間を有声音-無声音-無音の各クラスに分類することである.本論文では,2次元ケプストラムを利用して音声を有声音-無声音-無音の三つのクラスに分類する方法を提案している.2次元ケプストラムは,幾つかの連なった対数スペクトルの周波数と時間に対する2次元フーリエ変数で定義される.本方法は,音声の時間波形ではなくその対数スペクトル包絡に注目する方法なので,音源の不規則性により時間波形でピッチの周期構造が不安定な有声音区間でも比較的よく分類できる.しかも従来の方法とは異なり,本方法では2次元ケプストラムから得られる同種類のわずか四つのパラメータを用いるだけでよい.用いるパラメータは,対数スペクトル包絡の振幅の平均値,分散,その大体の傾き及び時間変化である.本方法で分類した結果は,誤り率が2%以下という極めて低いものであり,本方法の有効性を示している.更に,本方法では対数スペクトル包絡を考えているので,特に有声音の抽出に有効であり有声音抽出の誤り率は1%以下であった.
- Institute of Electronics, Information and Communication Engineersの論文
Institute of Electronics, Information and Communication Engineers | 論文
- Proposal of a Desk-Side Supercomputer with Reconfigurable Data-Paths Using Rapid Single-Flux-Quantum Circuits
- Interacting Self-Timed Pipelines and Elementary Coupling Control Modules
- A Lexicon-Driven Handwritten City-Name Recognition Scheme for Indian Postal Automation
- A Dual Transformation Approach to Current-Mode Filter Synthesis
- Acoustic Feature Transformation Combining Average and Maximum Classification Error Minimization Criteria