スペクトルのローカルピークを使った日本語単語中の破裂子音の認識
スポンサーリンク
概要
- 論文の詳細を見る
This paper describes the experiments on recognition of stop consonants in continuous speech by use of local spectral peaks. The spectrum obtained through a band pass filter bank is sampled every 10 ms. The sampled spectrum is represented by a binary valued vector in which every element denotes the presence or absence of a local peak. The frequency distribution of local spectral peaks in 40ms from the burst frame is transformed into the feature vector . And the conditional probability of the feature vector is used for the recognition . The experiments were carried out using 212 Japanese words uttered by 10 males and 10 females. The stop consonants are discriminated at a comparatively high rate using only the local spectral peaks. To improve the recognition rate for the unvoiced stops for the 10 male and 10 female speakers are 82. 6% and 79. 1% respectively, by the leaving-one-out experiments; those for the voiced stops are 74. 5% and 66. 1%. it turns out that the local spectral peaks and the temporal changes the spectra are very significant features for discriminating stop consonants.
- 社団法人日本音響学会の論文
著者
-
金 敬泰
Korea Electrotechnology And Telecommunications Research Institute
-
城戸 健一
Research Center for Applied Information Sciences, Tohoku University
-
牧野 正三
Research Center for Applied Information sciences,Tohoku University
関連論文
- 自動車車内騒音下単母音認識におけるA特性付加の効果
- FFTスペクトルのローカルピークを用いた母音認識
- 帯域信号の包絡線を使った音源寄与率の測定
- スペクトルのローカルピークを使った日本語単語中の破裂子音の認識
- スペクトルローカルピークを用いた母音の認識
- FFTに基づくBPFを用いた韓国語数字認識
- 複合複素正弦波モデルの入射音の方向と波形の推定への応用
- 振動解析によるボールベアリング回転論の表面粗さの高精度な推定
- 時間窓の推定インパルスレスポンスの精度に及ぼす影響
- 矩形パルスを用いたインパルスレスポンス推定法
- 音素認識に基づく不特定話者大語彙単語音声認識システム
- 火花放電を用いたパルス音源の指向特性について
- 非周的解析によるボールベアリングの微少な異常の検出
- 振動解析によるボールベアリングの傷音の検出
- 複台複素正弦波モデルの入射音の方向とスペクトルの推定への応用