大語彙連続音声認識エンジンJulius ver.4(システム,第9回音声言語シンポジウム)

概要

論文の詳細を見る
大語彙連続音声認識エンジンJuliusは2007年12月にバージョンver. 4がリリースされた.7年ぶりのメジャーバージョン更新となるver. 4では,内部構造のモジュール化およびソースの全面的な再構成が行われ,可搬性と柔軟性が大幅に向上された.その結果,エンジン本体がライブラリ化された他のアプリケーションに組み込めるようになったほか,コールバック・プラグイン等の外部との連携の仕組みが整備され,機能の拡張や構成の変更が容易に行えるようになった.言語モデルも単語N-gramおよび文法を単一バイナリで同等に扱えるようになりJulianはJuliusに統一された.さらに,複数の言語モデルと音響モデルを任意に組み合わせて,1エンジンで並列認識を行うマルチデコーディングも可能となった.また,基本性能についても拡張と強化が行われた.言語モデルとして孤立単語認識が新たに追加されたほか,4-gram以上の任意長N-gramへの対応、ユーザ関数による外部言語制約の組込み、GMM-based VADおよびデコーダベースVAD、confusion networkの生成など大幅な機能強化が行われた。性能は従来バージョンと同等を維持しており、かつメモリ量の削減も行われている。
社団法人電子情報通信学会の論文
2007-12-13