WFST駆動音声認識デコーダの最近の評価結果(デコーダ,第11回音声言語シンポジウム)

スポンサーリンク

概要

論文の詳細を見る
本論文では、東京工業大学で開発されているトランスデューサ駆動音声認識デコーダ(T^3)に対する最近の評価結果を報告する。二つのASRタスクによって評価を行った。一つ目のタスクは、JNASコーパスによる大語彙連続音声認識のトランスクリプションであり、二つ目は、乗換案内情報における音声検索のタスクである。まず、WFSTネットワーク構築方法の徹底比較によって、高速かつ高精度のネットワークの効率の良い構築方法について報告する。さらに、音声検索のタスクで、HTKとSphinxTrainの音響モデルを、T^3で比較し、その結果を報告する。実験の結果から、WFSTネットワークの構築において、logセミリングを使用した方が総合的に良く、T^3の柔軟性と高速性を新しいタスクによって確認することができた。
2009-12-14

著者

関連論文

もっと見る

スポンサーリンク