偏自己相関係数による数字音声認識の改良
スポンサーリンク
概要
- 論文の詳細を見る
According to the result of our previous report, the partial autocorrelation coefficients (PAC) seem to be the best parameter for Japanese spoken digit (limited vocabulary) recognition. In this paper, further improvement of the recognition score and several methods to prevent the recognition score from deterioration, when the simplified method of PAC extraction is used, are described. We adopted the nonuniform time pattern matching algorithm. and speaker's own utterances were used as the standards. The extraction error of PAC increased when the speech wave amplitude is small (Fig. 1). So the contribution of the matching of PAC to the recognition decision is weighted by the form of w(t)=(1+a(t))/2, where a(t) represents the normalized relative amplitude (a(t)≦1). Relatively good result was obtained (Fig. 2). We checked some techniques for the prevention of score from deteriorating when fixed point arithmetics with a short accumulator length are used in the PAC extraction. The use of only reliable PAC in the recognition improve the recognition score remarkably, for example, 88% to 99% using 18 bits fixed point accumulator. Smoothing of parameters along the time axis is also effective (Fig. 3). A few other method are tried but the results are rather negative. After all, the two methods proved to be useful . . . 1) weighted matching of PAC by signal amplitude of standard utterance when computation accuracy of PAC extraction is adequately high, 2) A combination of the use of only reliable PAC and smoothing of each parameters in the time axis when the accuracy is relatively low. We verified the validity of these two methods through recognition experiments with various standard utterances of the same speaker (Fig. 7, 8, 9), different speakers (Fig. 8), and another extraction calculation method (Fig. 9).
- 社団法人日本音響学会の論文
- 1973-07-01
著者
-
市川 熹
(株)日立製作所中央研究所第6部
-
中田 和男
(株)日立製作所中央研究所
-
中野 康明
株式会社日立製作所中央研究所
-
市川 熹
株式会社日立製作所中央研究所
-
中田 和男
株式会社日立製作所中央研究所
関連論文
- 時間的に変化する周波数スペクトルのオンラインカラー表示
- 音声情報処理の将来を考える
- 音声による会話のための自然言語処理
- 音声応答装置
- オンライン手書文字認識を用いた原稿校正システム
- オンライン手書き片仮名文字認識
- 日本語文音声のプロミネンス生成規則の作成と評価
- 日本語文音声におけるプロミネンスの韻律的特徴の解析
- 残差音源利用分析合成方式とマルチパルス法の基本特性の比較検討
- 残差音源型規則合成における女声音質改善方式の検討
- 偏自己相関係数による数字音声認識の改良
- 数字音声認識におけるパラメータの評価
- 周波数領域での階層的パタ-ン整合法による漢字認識
- 迫江氏に答える
- 「電話音声を対象とした話者照合」に対する迫江氏の疑問に答える
- 電話音声を対象とした話者照合
- 音声研究の現状と将来を語る
- ディジタル形多周波信号の新受信方式
- 音声素片を用いた単音節編集形音声合成方式における音声素片の作成法
- 実用からみた音声研究
- 音声の認識と発生
- 損失を考慮した声道の共振
- 京都音声シンポジウム
- 最近の音声合成技術 (最近の音声入出力技術)
- 音声入出力の技術動向 (開発すすむ音声入出力の装置化とアプリケ-ション技術)
- コンピュ-タによる音声・画像システム (最近のコンピュ-タ技術とその動向)
- 2. DSP の応用例 2.3 DSPの音声処理への応用 (DSP(ディジタル信号処理用プロセッサ))
- 音声情報処理の応用 (音声情報処理)
- 音声の合成と出力