音素セグメンテーションに基づく統計的音素セグメントモデルによる音声認識
スポンサーリンク
概要
- 論文の詳細を見る
自動抽出した音素セグメントから求めた音素特徴量を学習サンプルとしてトレーニングした新しい統計的音素セグメントモデルによる音声認識について述べる. 本提案のシステムでは, 認識の前処理としてセグメンテーションによって音素境界を検出した後, 統計的音素セグメントモデルで音素識別を行いスコア付き音素セグメントラティスを作成し, 辞書項目との記号列マッチングにより音声認識を行う. 使用するセグメンテーションシステムは高精度の音素境界の推定が可能なことから, 余分なパラメータを除去して音素分離に有効な特徴パラメータに着目し, 連続音声中の音素の認識問題を識別問題に帰着することができる. したがって, 比較的少量の学習データをもとにして不特定話者対応のモデルの作成が可能である. 10名分の音素バランス単語セット4,920単語から抽出した学習サンプルでトレーニングした統計的音素セグメントモデルを用いて, 非学習話者63名による未学習語彙^^い6,708単語に対する認識実験の結果, 単語辞書のサイズ212語の場合, 全話者平均で92.6%の認識率を得た.
- 社団法人電子情報通信学会の論文
- 1999-07-25
著者
関連論文
- 音声認識におけるルールベース法による話者独立音素セグメンテーション
- 音素セグメンテーションに基づく統計的音素セグメントモデルによる音声認識
- 音声認識における話者独立音素セグメンテーション
- 非直線周波数目盛における音声の一般化対数スペクトル包絡とそのモデル
- 体系的な意味カテゴリーで記述された係り受け関係を利用する日本語文音声認識
- 並列音素ラベリング (PPL) 方式による話者独立単語音声認識システム
- コンテキスト独立な音素認識により得られた信頼度付き音素ラティスを用いる単語音声認識
- 統計的音素セグメントモデルによる日本語音声認識に関する研究(学位論文の紹介)
- 複数のHMMセットを選択的に用いる話者独立音声認識
- 音韻環境依存型音素セグメントHMMによる音声認識
- 静的・動的パラメータを用いた英語連続音声の音素セグメンテーションシステム
- 音韻環境依存の音素レファレンスパターンを選択的に用いた英語連続音声中の音素認識
- 中国語連続音声認識における音素的セグメンテーション
- 特定話者任意語い連続音声の音素認識
- 多様な音韻環境における音素的単位のセグメンテ-ション (新しい音声処理技術特集)
- 連続音声の音素的単位へのセグメンテ-ション
- 中国語連続音声の4声認識
- 対数スペクトルの不偏推定
- 音声の規則合成のためのメルケプストラムCV音節デ-タファイルの自動作成
- 高品質音声合成のためのインパルス列等価音源
- CV音節のメルケプストラムパラメ-タの接続に基づく音声の規則合成
- 音声合成のためのメル対数スペクトル近似(MLSA)フィルタ
- 対数振幅特性近似フィルタを利用する楽器音の合成(技術談話室)
- FFNNによる音素ラベリング