マルチセグメントベクトル量子化のコードブックを用いる認識率の高い話者独立単語音声認識システム
スポンサーリンク
概要
- 論文の詳細を見る
認識率の高い話者独立単語音声認識システムの実現の一方法を提案する。認識の基本システムでは,適応メルケプストラム分析を用いて,認識のための特徴ベクトルを求める。単語音声のリファレンスとしては,マルチセグメントベクトル量子化のコードブックを用いる。提案する認識システムは,認識の基本システムによって高い精度で上位2候補の単語に絞り込み,二つの単語候補の言語音を比較して,その違いを強調する重みを付けた加重平均距離を求めることで認識を行う。本システムでは,認識対象の520単語の語彙中に音声が類似する単語を含む場合の認識でも誤りが少なく,テスト話者男女80人の平均認識率が98.44%と極めて良い結果を得ている。
- 2008-05-01
著者
関連論文
- 適応メルケプストラム分析を利用した音声符号化とその評価
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- RBFネットワークのハイブリッド学習アルゴリズム
- 改良DFT-MUSIC法を用いた低SNR環境における瞬時周波数の推定
- 低SNR環境下における瞬時周波数の推定
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- 雑音劣化音声の一般化ケプストラムモデル化における事前情報の利用
- マルチセグメントベクトル量子化のコードブックを用いる認識率の高い話者独立単語音声認識システム
- 体系的な意味カテゴリーで記述された係り受け関係を利用する日本語文音声認識
- 演算式歯形測定器
- 並列音素ラベリング (PPL) 方式による話者独立単語音声認識システム
- コンテキスト独立な音素認識により得られた信頼度付き音素ラティスを用いる単語音声認識
- 静的・動的パラメータを用いた英語連続音声の音素セグメンテーションシステム
- メル一般化ケプストラム係数に基づく音声のスペクトル表現とその諸特性
- 動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム
- 動的特徴を用いたHMMに基づく音声合成
- 意味解析と最適探索を利用した中国語文音声認識
- 大語彙中国語連続音声認識の言語処理システム
- メルケプストラムをパラメータとするHMMに基づく音声合成
- HMMからの音声パラメータ生成アルゴリズム
- メル一般化ケプストラム分析による音声のスペクトル推定
- メル一般化ケプストラム分析に基づくCELP符号化
- メル一般化ケプストラムによる音声のスペクトル表現とその諸特性
- メルケプストラムをパラメータとするCELP符号化系
- 中国語連続音声の声調認識
- 中国語連続音声の四声認識