複数話者の音声認識における音源方向経路間距離を用いた3-D N-best探索法の改善
スポンサーリンク
概要
- 論文の詳細を見る
ハンズフリー音声認識において、話者の位置を推定することは非常に重要である。その方法として、--長時間のパワーを用いて話者の位置を推定する方法がある。しかしこの方法では、SNRが低い環境下においては、一の位置を推定することは難しいという問題がある。この問題を解決する方法として、これまでに話者位置推定と識を統合した3-Dビタビ探索法を提案している。しかしこの方法は、話者が1人の場合には話者位置推定お上識において有効な方法であったが、複数の話者には対応できないどう問題があった。そこで著者らはこれまでに、の話者が同時に発話しても認識が可能である方法を提案している。その方法とは、3-Dビタビ探索法を拡張させて、入力フレーム、HMM状態、話者方向で構成される3-Dトレリス空間内で、N-beSt探索を行なうことである。本稿では、音源方向経路間の距離に基づいてクラスタリングを行なうことにより、3-DN-beSt探索法の改善を試みたので、その方法について報告する。
- 社団法人電子情報通信学会の論文
- 1999-12-20