音声スペクトルのローカルピークの静特性のもつ音韻情報に関する検討 : スペクトルのローカルピークを用いた単語音声中の音韻情報の抽出 (その1)
スポンサーリンク
概要
- 論文の詳細を見る
A recognition system Composed of the following three steps is proposed in our research on the automatic recognition of speech; that is, the first step is the extraction of acoustic parameters, the second is the transformation of the acoustic parameters into a series of features by which the kind of the phoneme of each part of speech is distinguished, and the third is the transformation of the series of features into a string of characters or some symbols which has linguistic meaning as a word or a short sentence. The use of the linguistic information is considered to be effective in the third step. In the first and second steps, the local peaks in the short time spectra analyzed by a filter bank composed of 29 single peak filters of low selectivity are treated as the acoustic parameters. And some experiments on many vowel samples uttered in isolation and in continuation by 31 male adults have been carried out to investigate the effectiveness of the use of the local peaks as the acoustic parameters for the recognition. The usefulness of the local peaks for the discrimination of vowels was verified by experiments. The use of the spectral local peaks is based on a speculation that the local peaks may play a significant role in the processing of speech signal after the frequency analysis by cochlea, and also on an expectation that variation of the features with time may easily be treated by use of the local peaks. The formant frequencies may have, of course, similar properties to those of the spectral local peaks, but it is incredible that the formant frequencies are exactly extracted in the auditory organ. The spectral local peaks are considered to be sufficient for the use in the preprocessor of a speech recognition system by use of linguistic information, such as the use of the words dictionary, according to the results of investigation on the characteristics of the local peaks. The discrimination experiments on vowels and consonants in the names of Japanese twenty cities uttered by 5 male adults, from which the standard patterns for the discrimination of phoneme groups were made by use of the static properties of the spectral local peaks are described in this paper. The speech samples are frequency-analyzed by a filter bank composed of 29 single peak filters of Q≒6. The central frequencies of the filters are taken at intervals of 1/6 octave from 250 Hz to 6300 Hz. Three major spectral local peaks P1, P2 and Pe3 are picked out in every 10ms from the six largest local peaks of the fequency spectrum obtained by analyses with the filter bank by applying two peak processing rules. The frequencies of those local peaks are treated as the acoustical parameters. The set of the acoustic parameters is transformed into a code expressing the phoneme in accordance with the domain on P1-P2 and P2-Pe3 planes on which each set falls. A series of the codes is thus obtained from an utterance. The averaged score of the recognition of vowels was 80%. And the scores of the transformation of the consonant parts into corresponding phoneme groups were more than 80% except for voiced plocives (47%). These scores are not lower than those of the discrimination of speech segments by the human auditory sense. And the results obtained are considered to be sufficient for the use in the preprocessor of a speech recognition system by use of linguistic information.
- 社団法人日本音響学会の論文
- 1976-01-01
著者
関連論文
- 363 名鉄ホールの1/25立体模型による音響試験 : 特に可動反射板の影響について(計画・設備)
- インターノイズ76
- 簡単な振幅制限素子をもつ防振機構について
- 3022 中電ホールの電気音響装置(環境工学・設計計画,第1回 日本建築祭 研究発表会 学術講演要旨集)
- 3021 中電ホールの音響特性(環境工学・設計計画,第1回 日本建築祭 研究発表会 学術講演要旨集)
- 3020 中電ホールの立体模型による音響試験(環境工学・設計計画,第1回 日本建築祭 研究発表会 学術講演要旨集)
- 室内における音質の主観的評価に関する実験 : その1.音場の合成と残響音の時間遅れの効果
- 3058 仙台日立ミュージックホールの音響特性と音響装置(計画)
- 3053 CBCラジオ第一スタジオの音響模型1/12.5実験(計画)
- 3040 札幌市民会館の音響特性について(計画)
- 3013 三つのオーデイトリアムの音響特性測定結果について(計画・設備)
- 15. 杉並公会堂の1/25立体模型による音響試験
- 12. 材料の吸音率測定結果について
- 365 材料の吸音率測定結果について(計画・設備)
- 364 杉並公会堂の1/25立体模型による音響試験 : 特に開閉反射板の効果について(計画・設備)
- 324 中部日本放送ホールの1/25模型による音響実験(計画)
- 10 福島県会議事堂の音響特性(その二) : II 仮縫実験及び完成後の音響特性
- 9 福島県会議事堂の音響特性(その一) : I 音響計画、モデル実験、音響設計
- 室の音響特性の測定装置
- 紙の弾性常数に関する模型的考察
- 円錐型動電拡声器の研究正誤表
- 円錐型動電拡声器の研究
- 円錐型拡声器の研究(總括)
- 65.中部電力ホールの音響特性(第4部(基本計画,設計々画,設備関係))
- 64.中電ホールの音響装置(第4部(基本計画,設計々画,設備関係))
- 63.中電ホールの立体模型による音響試験(第4部(基本計画,設計々画,設備関係))
- ホルマント周波数の聴覚心理的記述と母音認識
- 短音によるLoud speakerの特性測定について
- Cone紙の振動定数に関する一考察
- ベンガル語連続音声中の母音のホルマント周波数について
- ベンガル語単母音のホルトマント周波数
- 曲線配列音源の一設計法とその近傍音場音圧分布
- 直線配列音源の近傍音場特性
- 球上の多重音源による定音圧音場の構成
- 辞書と音形規則を利用した単語音声の認識
- 音声研究の現状と将来を語る
- 鼻音のスペクトルに及ぼす鼻副鼻腔の影響
- スペクトルのピークを用いた単語音声の認識とその評価
- 音声スペクトルのローカルピークの動特性の検討と単語音声認識への利用 : スペクトルのローカルピークを用いた単語音声中の音韻情報の抽出(その2)
- 9次元ベクトルによる音素群の表現とその音声認識への利用
- 時間的に変動するホルマント周波数で表される母音刺激音の知覚
- 音声スペクトルのローカルピークの静特性のもつ音韻情報に関する検討 : スペクトルのローカルピークを用いた単語音声中の音韻情報の抽出 (その1)
- 母音知覚における音素環境の影響
- 鼻子音のスペクトル特徴の抽出のための一方法
- 年令, 性別による日本語5母音のピッチ周波数とホルマント周波数の変化
- 鼻音性の音響関連量について
- 両唇音/b,w,m/の知覚のキューとしての調音の性質
- 鼻音性抽出のための能動モデルとその知覚的評価
- 音声スペクトルの概略形とその動特性を利用した単語音声認識システム
- 電気計算機による室内音響設計法に関する二, 三の基礎的考察
- 母音知覚の性質を利用した母音認識の方法
- VCV音節中の母音知覚における文脈効果
- 母音の短期記憶の保持曲線