単語trigramを用いた大語彙連続音声認識

スポンサーリンク

概要

論文の詳細を見る
大語彙連続音声認識システムの性能は,音響モデルだけではなく,使用する言語モデルの性能にも大きく依存する.本研究では,言語モデルとして日本語で初めて,マルチパスアプローチによって単語trigramを適用した.語彙を7000語に限定した上で,日経新聞約5年分のテキストから言語モデルを学習し,不特定話者の音声を用いた新聞文章の読み上げタスクによって評価を行った結果,従来の単語trigram言語モデルを用いた場合より誤り率が約44%削減され,単語正解精度で約90%の性能を得ることが出来た.
一般社団法人情報処理学会の論文
1996-12-12

著者

関連論文

もっと見る

スポンサーリンク