SP2000-23 言語モデルの役割と韻律情報との相互作用を用いた大語彙連続音声認識の探索空間の最適制御

スポンサーリンク

概要

論文の詳細を見る
情報源としての韻律-統語境界は音声認識における探索空間の制約に利用することが可能である。本論文では大語彙連続音声認識における単語間遷移と単語内部遷移を考慮した動的ビーム探索の方法を提案し、既存の認識デコーダに韻律-統語境界を導入することを考慮する。大語彙連続音声認識における木構造単語辞書の問題は言語モデルのスコアの適用がビーム探索の音響モデルのスコアの適用と整合されないことであり、巨大な探索空間を必要とする。本稿ではビーム幅を選択する場合の言語モデルの影響と韻律-統語境界情報を利用する戦略を延べ、効率的に計算量を減少させる方法を提案する。評価実験は日本語新聞記事文章2万単語タスクとn-gram言語モデルに対し行ない、その結果から提案したアルゴリズムの有効性を証明する。
社団法人電子情報通信学会の論文
2000-06-16

著者

関連論文

もっと見る

スポンサーリンク