発声速度に基づく音素持続時間予測を用いた音素認識
スポンサーリンク
概要
- 論文の詳細を見る
本稿では入力音声の発声速度に基づいて音素持続時間を予測し、それをもとにした音素認識法を提案する。発話単位内での発声速度の変動はあまりないため、平均母音長の1次回帰式により発声中の音素の持続時間を予測し、入力音声への適応を行なう。本稿では、文節発声データをもとに発話単位内の発声速度と持続時間の関係の分析を行なった。また、発声中の音素持続時間を予測し、その結果を音素認識に利用することで音素認識率84.6%を得た。これは予測を行なわない場合に比較し3.1%の認識率の向上である。
- 社団法人電子情報通信学会の論文
- 1996-06-14
著者
関連論文
- 確率尺度によるDPマッチングを用いた音素のセグメンテーション
- 音素の持続時間と連接情報を用いたセグメンテーション
- キーワードスポッティングとセマンティックフレームを用いた意味解析
- 自己相似性を用いたLSP係数のセグメント量子化
- 予備認識結果にもとづく持続時間予測の音素認識における効果
- ケプストラムベクトルにおける個人性の分析
- 入力の発声速度を考慮した単語音声認識
- 発話における発声速度と音素持続時間の関係の分析
- 発声速度に基づく音素持続時間予測を用いた音素認識
- 2重マルコフモデルを用いた日本語文書認識後処理
- 対話音声認識のための文節構造モデル