入力の発声速度を考慮した単語音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本論文では入力音声の発声速度を考慮した単語音声認識法を提案する。各単語標準パターン中の音素の持続時間を、入力より求めた平均母音長の一次回帰式により推定する。入力の平均母音長の推定には、修正LVQ2法の結果を用いる。入力の発声速度を考慮して作成された単語標準パターンの音素系列と、入力の音素尤度ベクトル列との比較をDPマッチングを用いておこなう。単語認識率98.2%を得た。次に、音素尤度ベクトルの方向性を利用する方法を提案する。各音素の平均値ベクトルをターゲットベクトルとみなし、これを予測された音素の持続時間を考慮して、臨界制動関数で平滑化し、各単語の音素尤度ベクトル列を作成し標準パターンとする。これと入力音声の尤度ベクトル列をベクトルの方向性を考慮してDPマッチングを行なう。
- 社団法人電子情報通信学会の論文
- 1993-08-19
著者
-
曽根 敏夫
Graduate School Of Information Science Tohoku Univerisity
-
牧野 正三
東北大学情報科学研究科
-
曽根 敏夫
東北大学情報科学研究科
-
大坂 幸弘
東北大学情報科学研究科
関連論文
- 確率尺度によるDPマッチングを用いた音素のセグメンテーション
- 音素の持続時間と連接情報を用いたセグメンテーション
- 側方抑制を考慮した音色弁域推定モデル
- 高次高調波成分のみからなる複合音の音色弁別過程に関する一考察
- Delayed-x LMSアルゴリズムの収束速度に関する検討
- 参照信号間に相関がある場合のFiltered-x LMSアルゴリズムの収束速度の改善法
- Delayed-x LMS アルゴリズムの適用条件に関する検討
- 二次音源の数と制御点の数が異なる場合のANCシステムの収束特性
- キーワードスポッティングとセマンティックフレームを用いた意味解析
- 自己相似性を用いたLSP係数のセグメント量子化
- セカンダリーパスの影響削減によるLMS型アルゴリズムを用いた騒音のアクティブ制御の収束特性の改善
- フィルタードXLMSアルゴリズムを用いた能動騒音制御システムの消音性能にモデリングエラーが及ぼす影響
- 予備認識結果にもとづく持続時間予測の音素認識における効果
- ケプストラムベクトルにおける個人性の分析
- 入力の発声速度を考慮した単語音声認識
- 音素・文字間の遷移情報を用いた単語認識の性能予測
- カテゴリ間の遷移情報を用いた文認識系の能力評価法
- 言語情報を利用した文字認識における文字認識率と単語認識率の関係
- 発話における発声速度と音素持続時間の関係の分析
- 発声速度に基づく音素持続時間予測を用いた音素認識
- 能動騒音制御システムにおけるプライマリー及びセカンダリーパスの最適なオンライン同定
- 2重マルコフモデルを用いた日本語文書認識後処理
- 対話音声認識のための文節構造モデル