日本語ディクテーション基本ソフトウェア(97年度版)の性能評価

スポンサーリンク

概要

論文の詳細を見る
「日本語ディクテーション基本ソフトウェア」は、大語=連続音声認識(LVCSR)研究・開発の共通プラットフォームとして設計・作成された。これは、複数の大学・公的研究機関の研究者の協力プロジェクトの成果である。このプラットフォームは、標準的な認識エンジン・日本語音響モデル・日本語言語モデルから構成される。音響モデルは、日本音響学会の音声データベースを用いて学習し、monophoneから数千状態のtriphoneまで用意した。語=と単語N-gram(2-gramと3-gram)は、毎日新聞記事データベースを用いて構築した。認識エンジンJULIUSは、音響モデル・言語モデルとのインターフェースを考慮して開発された。これらのモジュールを統合して、5000語=の日本語ディクテーションシステムを作成し、種々の要素技術の評価を行なった。本ツールキットは、無償で一般に公開されている。
一般社団法人情報処理学会の論文
1998-05-28

著者

関連論文

もっと見る

スポンサーリンク