音素クラスタモデルを用いた未登録語検出法の検討
スポンサーリンク
概要
- 論文の詳細を見る
すべての音素を数種類のクラスタに分類し作成した音響モデル(音素クラスタモデルと呼ぶ)を用いた未登録語検出法を提案する. ここでは, 日本語の音節構造を考慮したクラスタモデル, 音響モデルの自動クラスタリングにより決定したクラスタモデル, 全音素を一つのクラスタとしたクラスタモデルの比較検討を行った. 未登録語を含んだ文章の未登録語検出実験において, 日本語の音節構造を考慮した音素クラスタモデルは, 従来の音素ごとのモデルを用いる方法と比較して, 処理量を約半分に削減しながらほぼ同等の単語accuracyを達成することができた. このことから, 提案する方法が処理量を抑えた未登録語検出に, 有効であることがわかった. またこのとき, 未登録語区間のスコアに対して, クラスタN-gramの確率をペナルティとして使用することが, 有効であることがわかった. また, 多段階による認識方式の1段階目として本提案法により未登録語を検出し, 2段階目で検出された未登録語の音素系列を認識する方式についても述べる.
- 1997-09-25
著者
-
松永 昭一
ATR音声翻訳通信研究所
-
坂本 博之
ATR音声翻訳通信研究所
-
松永 昭一
Atr音声翻訳通信研究所:nttヒューマンインタフェース研究所
-
坂本 博之
Atr音声翻訳通信研究所:日通工中央研究所
関連論文
- 最大事後確率推定法と適応データ量に応じた平滑化手法を用いた話者適応
- MAP-VFS話者適応法における平滑化係数制御の効果
- 発話/話者適応による自由発話音声中の音素認識
- 最大事後確率推定法と移動ベクトル場平滑化法を統合した話者適応方式
- 話者適応のための木構造話者クラスタリング
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 逐次状態分割法の分割過程木構造を用いた話者適応方式の検討
- 逐次状態分割法の分割過程を考慮した移動ベクトル場平滑化の検討
- 音素クラスタモデルを用いた未登録語検出法の検討
- 音素クラスタモデルを用いた未登録語の検出法の検討
- 連続音声認識における未知語検出の検討
- 大語い連続音声認識のための単語仮説数削減
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 語順の制約による探索空間の削減効果
- 音素履歴木を用いたフレーム同期型SSS-LR文音声認識
- 連続音声認識のための品詞・単語可変長N-gram
- 連続音声認識のための可変長連鎖統計言語モデル
- 状態別話者クラスタリングを用いた不特定話者モデルの検討
- 係り受けの整合性を考慮した文節例の音声認識 (ヒュ-マンインタフェ-ス特集) -- (音声)
- 音素単位の音声認識のための単語/文節候補の選択