連結学習における音韻ラベル表記、学習データ量およびHMMパラメータ補正に関する検討
スポンサーリンク
概要
- 論文の詳細を見る
連結学習における学習音声データと音韻ラベル列の不一致によるHMM認識性能の低下を解消するため、前処理として、音韻ラベル列の検出を導入し、検出された音韻ラベル列にしたがって学習処理を行う方法を提案する。ラベル検出は、対象学習文の仮名表記にしたがって検出オートマトンを生成し、学習データを認識することによって実現する。文中の任意のポーズ、鼻濁音、長音、助詞の「は」と「へ」を対象に検出し、連続音声認識実験で効果を確認した。ラベル検出しないベースラインと比べて、文認識率が68.1%から81.4%に、単語認識精度が91.3%から95.0%にそれぞれ改善された。さらに、学習不十分なトライフォンHMMに対して、パラメータ補正を施し、誤認識率が最大6.7%〜10.8%低減できた。
- 社団法人電子情報通信学会の論文
- 1995-06-22
著者
関連論文
- 音声認識実用化技術の展開(総合報告)
- 正方形マイクロホンアレイによる音源分離技術 (特集 音声認識技術の実用化への取り組み)
- 4 正方形マイクロホンアレイによる音源分離技術(音声認識技術の実用化への取り組み)
- 音声認識実用化技術の展開
- 利用形態を考慮した音声合成品質の評価
- テキスト音声変換LSIの開発
- 臨場感テレワークにおける音処理技術 (ユビキタス社会のテレワーク特集)
- 法則合成技術の研究
- 正方形マイクロホンアレイによる音源分離技術
- 大語彙単語音声認識における予備選択に関する検討
- HMM状態のマルチ共有による音声認識 (先端技術特集)
- 拡張LBGアルゴリズムによるHMM状態のマルチ共有
- HMM状態のマルチ共有に関する検討
- 状態クラスタ間の遷移確率を用いた認識対象外発話のリジェクション法
- 状態多元共有における共有構造の再推定
- HMMの状態または分布の多元共有に関する検討
- 連結学習における音韻ラベル表記、学習データ量およびHMMパラメータ補正に関する検討
- 不特定話者連続音声認識方式の研究 (先端技術特集)
- A-10-8 複数のマイクロホンアレイを用いたエリア毎の音声強調技術(A-10.応用音響,一般セッション)
- A-4-23 適応ノッチフィルタの検討(A-4.信号処理,一般セッション)
- A-4-9 ミュージカルノイズを軽減したスペクトル減算法(A-4.信号処理,一般セッション)
- A-4-12 ハウリング抑圧における適応ノッチフィルタの音質改善(A-4.信号処理,一般セッション)
- スペクトル減算型音声強調方法におけるミュージカルノイズ軽減方法
- スペクトル減算型音声強調方法におけるミュージカルノイズ軽減方法