音声とテキストを用いた認識単語辞書の自動構築

概要

論文の詳細を見る
大語彙連続音声認識(LVCSR)システムを新しい分野に導入する場合,その分野特有の単語を認識単語辞書に追加しなければならないが,計算量や認識単語辞書のメンテナンスを考慮すると,必要な分野特有の単語とその正しい読みのみを選択的に追加することが望ましい.しかし,日本語は,単語間に空白が置かれず,読みにもあいまい性があるため,対象分野のテキストデータのみから分野特有の単語とその読みを正しく自動的に獲得することは困難である.本論文では,対象分野のテキストデータに加えて,音声データも利用することで,対象分野特有の単語とその読みを含む小さいサイズの認識単語辞書を自動構築する方法を提案する.提案手法では,最初にテキストデータから再現率を重視した方法で大きいサイズの認識単語辞書を作成した後,その中から,音声データを利用して必要な単語と読みを選択し,小さいサイズの認識単語辞書を構築する.実験により,音声データを利用することで,最初の認識単語辞書のサイズの10%以下の小さい認識単語辞書の追加で,対象分野のLVCSRシステムを構築することができ,それが従来手法と比較して良い認識精度を示すことを確認した.
一般社団法人情報処理学会の論文
2008-08-15