単語のtrigramを利用した文音声認識と自由発話認識への拡張
スポンサーリンク
概要
- 論文の詳細を見る
人間同士のコミュニケーションでは、「あの-」、「え-と」などに代表される冗長語や、言い淀みや言い誤りおよび言い直しなどが頻繁に出現する。このような音声でも認識できる、いわゆる自由発話の音声認識が、今後の重要な研究課題になると思われる。本論文では、初めに単語trigramとViterbiサーチ(one-pass DP)を基本とする文音声認識アルゴリズムを述べる。次にメモリ量や計算量を削減したアルゴリズムについて述べる。この改善は、ビームサーチやViterbiの経路計算の改良などをすることにより得られた。この改良により、このアルゴリズムでは、各時刻・各状態において最尤の単語列を知ることができる。この特徴を生かして、音響モデルでは冗長語を認識しながら言語モデルでは冗長語をスキップすることにより、冗長語を含んだ音声を認識することができる。最後に自由発話の認識を行なった。その結果、このアルゴリズムの有効性が示された。
- 社団法人電子情報通信学会の論文
- 1994-01-20
著者
関連論文
- Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討
- N信号源モデルに基づく音声の区分化識別問題 : 話者特徴の違いに基づく区分化音声の識別
- 自由発話音声における音響的な特徴の検討
- Spotterにおける認識アルゴリズムの検討
- 音声対話における言語現象 (<小特集>音声によるコンピュータとの対話を目指して)
- 単語のtrigramを利用した文音声認識と自由発話認識への拡張
- 隠れマルコフモデルによる言語モデル自動獲得の検討