ピッチとスペクトルの相関を用いたHMM音素認識
スポンサーリンク
概要
- 論文の詳細を見る
本論文では、ピッチとスペクトルの相関を利用して、ピッチ情報を音素HMMのパラメータに反映させた新しい音声認識手法を提案する。本手法は、ピッチを利用した従来の手法とは異なり、ピッチパターンは直接利用せず、ピッチとスペクトルの間に存在する相関関係を用いて、スペクトルパラメータをフレーム毎に正規化して使用することを特徴としている。これによって音素認識性能の向上に直接結び付くと考えられるいくつかの効果が得られた。更に、連続発声された日本語音声中の24音素に対する認識実験では、ピッチ情報によるスペクトルパラメータの正規化を行なわない場合に比べて、誤認識率が8%減少することが分かり、本手法の有効性を確認した。
- 社団法人映像情報メディア学会の論文
- 1991-09-27
著者
-
嵯峨山 茂樹
ATR自動翻訳電話研究所
-
嵯峨山 茂樹
Atr Interpreting Telephony Research Laboratories
-
シンガー ハラルド
ATR Interpreting Telephony Research Laboratories
-
シンガー ハラルド
ATR自動翻訳電話研究所
関連論文
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- ピッチ周波数依存音素モデルによるHMM音声認識
- 隠れマルコフ網と一般化LR構文解析を統合した連続音声認識
- 混合連続分布HMM移動ベクトル場平滑化話者適用方式
- ATR音声言語翻訳実験システムASURA
- HMMを用いた形態素解析
- ニューラルファジィ学習法による音声認識の性能向上
- 3)ピッチとスペクトルの相関を用いたHMM音素認識(視聴覚技術研究会)
- 数理統計モデルによる音声認識の現状と将来 (<特集>音声)
- ピッチとスペクトルの相関を用いたHMM音素認識
- 隠れマルコフモデルによる言語モデル自動獲得の検討
- 双方向網探索によるHMM文節音声認識系の評価
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- 日英音声翻訳システムATR-MATRIXにおける音声認識用音響・言語モデル
- MCE/GPDを用いた自然発話音声認識における不特定話者音響モデルの改善
- クライアント・サーバ型 ATR-MATRIX
- 4E-7 ATR-MATRIX:日英双方向音声翻訳システム
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 大規模な日本語音声データによる音響モデルの分析
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- SCALAR QUANTIZATION OF CEPSTRAL PARAMETERS FOR LOW BANDWIDTH CLIENT-SERVER SPEECH RECOGNITION SYSTEMS
- 母音および無音のHMMを用いた音声始端検出法
- 音響モデルの構造決定のための統一的な枠組 : 最尤推定による逐次状態分割法と質問に基づく決定木生成法
- PARALLEL JAPANESE/ENGLISH SPEECH RECOGNITION IN ATRSPREC
- DISTANCE-RELATED UNIT ASSOCIATION MAXIMUM ENTROPY LANGUAGE MODELING
- 日英音声翻訳システム「ATR-MATRIX」における音声認識部分の構造と制御方法