オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価(音声,聴覚,<特集>システム開発論文)

概要

論文の詳細を見る
重要な語に着目し,その誤りの最小化を行う汎用音声認識エンジンを実現したので,その実装と評価について述べる.我々はこれまでに,各語の重要度を考慮した誤り率「重みつき単語誤り率(Weighted Word Error Rate: WWER)」を,ベイズリスク最小化(Minimum Bayes-Risk: MBR)に基づいて行う音声認識の方式(MBR音声認識)の効果を確認している.しかし,これを実現する音声認識エンジンで一般に利用可能なものは存在しなかった.このような背景に基づき,我々は誰もが利用可能なMBR音声認識エンジンの実現を行った.具体的には,現在最も広く利用されているオープンソースの音声認識エンジンの一つであるJuliusにMBR機能を実装して実現を行った.その際,従来のJuliusと入出力の互換性が保たれるようにMBR機能の追加を行った.単語の重要度を指定するだけで,WERを含むさまざまな誤り尺度(WWER)が少ない認識結果を従来のJuliusとほぼ同程度の時間で探索できるデコーダ(MBR-Julius)を実現できた.更に,実際の音声検索タスクへの適用を行い,適用の容易性及びその効果(検索精度の向上への貢献)も示した.
2013-10-01