音素認識に基づく不特定話者大語彙単語音声認識システム
スポンサーリンク
概要
- 論文の詳細を見る
This paper describes a speaker-independent spoken word recognition system for a large size vocabulary. Speech is analyzed by the filter bank, from whose logarithmic spectrum the 11 features are extracted every 10 ms. Using the features the speech is first segmented and the primary phoneme recognition is carried out for every segment using the Bayes decision method. After correcting errors in segmentation and phoneme recognition, secondary recognition of a part of the consonants is carried out and the phonemic sequence is determined. The word dictionary item having maximum likelihood to the sequence is chosen as the recognition output. The 75. 9% score for the phoneme recognition and the 92. 4% score for the word recognition are obtained for the training samples in the 212 words uttered by 10 male and 10 female speakers. For the same words uttered by 30 male and 20 female speakers different from the above speakers, the 88. 1% word recognition score is obtained.
著者
-
城戸 健一
Research Center for Applied Information Sciences, Tohoku University
-
牧野 正三
Research Center for Applied Information sciences,Tohoku University
-
本間 茂
Research Center For Applied Information Sciences Tohoku University
関連論文
- 帯域信号の包絡線を使った音源寄与率の測定
- スペクトルのローカルピークを使った日本語単語中の破裂子音の認識
- スペクトルローカルピークを用いた母音の認識
- FFTに基づくBPFを用いた韓国語数字認識
- 複合複素正弦波モデルの入射音の方向と波形の推定への応用
- 振動解析によるボールベアリング回転論の表面粗さの高精度な推定
- 時間窓の推定インパルスレスポンスの精度に及ぼす影響
- 矩形パルスを用いたインパルスレスポンス推定法
- 音素認識に基づく不特定話者大語彙単語音声認識システム
- 火花放電を用いたパルス音源の指向特性について
- 非周的解析によるボールベアリングの微少な異常の検出
- 振動解析によるボールベアリングの傷音の検出
- 複台複素正弦波モデルの入射音の方向とスペクトルの推定への応用