日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)

スポンサーリンク

概要

論文の詳細を見る
近年, 自然発話に近い大規模な音声データベースを用いて, 大語彙連続音声認識が研究されている.本論文では, 2004年6月に公開された「『日本語話し言葉コーパス: CSJ』最終公開版」の書き起こしテキストを用いて, 音声に忠実な読みを持つ形態素解析データを作成し, その解析データから構築した言語モデル(これを, 発音変形依存モデルと呼ぶ)の性能評価を行う.さらに, 音響モデル, 言語モデルに対して評価セットの認識結果を用いて教師なし適応を繰り返し行い, その性能について評価する.公開版CSJのtestset1により評価した結果, 発音変形依存モデルを用いて平均19.96%の単語誤り率を達成し, 教師なし適応を繰り返し行うことで, 最終的に平均15.41%の単語誤り率を達成した.
社団法人電子情報通信学会の論文
2005-12-14

著者

関連論文

もっと見る

スポンサーリンク