音素クラスタモデルを用いた未登録語の検出法の検討
スポンサーリンク
概要
- 論文の詳細を見る
本稿は、認識処理量の増加を抑えて精度良く未登録語を検出するための音素クラスタモデルを用いた音声認識のアプローチについて述べる。この音素クラスタモデルは音素をいくつかのクラスタに分類し、クラスタ毎に作成した音響モデルである。本稿では日本語の音節構造を考慮したクラスタモデル、音響モデルの自動クラスタリングのアルゴリズムを用いて決定したクラスタモデル、全音素を1つのクラスタとした場合のクラスタモデルの比較検討を行なった。未登録語を含んだ文章の認識実験において、日本語の音節構造を考慮した音素クラスタモデルを用いた未登録語処理を行なうことにより、未登録語処理なしの場合の単語accuracy 58.1%に対して70.3%を達成した。また音素クラスタモデルを使用する方法は、音素モデルをそのまま使用する方法と比較すると、処理時間を約半分に削減しほぼ同等の認識性能を達成していることから未登録語の検出に有効であることが分かった。
- 1995-11-16
著者
-
松永 昭一
ATR音声翻訳通信研究所
-
松永 昭一
Atr音声翻訳通信研究所:現在 Nttヒューマンインタフェース研究所
-
坂本 博之
ATR音声翻訳通信研究所
-
坂本 博之
Atr音声翻訳通信研究所:日通工中央研究所
関連論文
- 最大事後確率推定法と適応データ量に応じた平滑化手法を用いた話者適応
- 話者クラスタリング手法を用いた不特定話者音素HMM作成法
- MAP-VFS話者適応法における平滑化係数制御の効果
- 発話/話者適応による自由発話音声中の音素認識
- 木構造話者クラスタリングを用いた話者適応
- 最大事後確率推定法と移動ベクトル場平滑化法を統合した話者適応方式
- 話者適応のための木構造話者クラスタリング
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 逐次状態分割法の分割過程木構造を用いた話者適応方式の検討
- 逐次状態分割法の分割過程を考慮した移動ベクトル場平滑化の検討
- 音素クラスタモデルを用いた未登録語検出法の検討
- 音素クラスタモデルを用いた未登録語の検出法の検討
- 連続音声認識における未知語検出の検討
- 大語い連続音声認識のための単語仮説数削減
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 語順の制約による探索空間の削減効果
- 音素履歴木を用いたフレーム同期型SSS-LR文音声認識
- 品詞および可変長単語列の複合N-gramの自動生成
- 連続音声認識のための品詞・単語可変長N-gram
- 連続音声認識のための可変長連鎖統計言語モデル
- 状態別話者クラスタリングを用いた不特定話者モデルの検討