学習用テキストからの認識探索空間作成能力の評価
スポンサーリンク
概要
- 論文の詳細を見る
従来、連続音声認識では、大規模な学習テキストを用いてn-gramモデルなどの統計的言語モデルを作成し、認識性能を向上させてきた。また、構文も併用され、学習テキストと構分に関する知識を元に、人為的に作られていた。構文は、認識探索空間を制約し、処理速度、認識性能を向上させる。特に、大語彙や未知語、比較的自由な構文などを扱うDictationシステムの場合には探索空間が非常に大きくなり、構分の記述は重要な要素である。一方、認識探索空間を自動的に制約することは、学習テキストのみでも可能である。しかし、この場合には、学習テキストに含まれない未知の構文(単語系列)が入力された場合、処理不能となる。これを回避するためには、さらに膨大な学習テキストを収集すれば良いが、非常にコストのかかる仕事である。従来は、人手による構文作成時に、他の文例等の知識を利用して回避していた。そこで、我々は既存の学習テキストとその統計量から、学習テキストに含まれず、かつ、出現確率が高いと推定されるテキストを生成し、そのテキストと既存の学習テキストから探索空間を限定した認識法を提案した。即ち、未知の構文に対処するために、テキストを生成した。本稿では、この認識法の探索範囲制約の程度を変えたときの、処理量と認識性能について検討する。
- 一般社団法人情報処理学会の論文
- 1993-03-01
著者
関連論文
- 音素認識と係り受け解析による文音声の認識 (音声音響情報処理の研究・開発)
- 音韻ラベルを用いない HMM 評価法とそれを用いた連続音声認識用 HMM の評価
- 番号案内を対象とした大語い連続音声認識アルゴリズム
- フレーム間相関を利用した音韻 HMM による音声認識
- 電話番号案内を対象としたマルチモーダル対話システムの作成と音声入力の評価
- 実対話音声を用いた有限状態トフンスデューサ型認識デコーダの評価
- 話者クラスタリング手法を用いた不特定話者音素HMM作成法
- 木構造話者クラスタリングを用いた話者適応
- VQコードのBigramで制約した音韻HMMによる音声認識
- 学習用テキストからの認識探索空間作成能力の評価
- 音節連鎖統計情報のタスク適応化
- Top-Down音韻認識とBottom-Up音韻認識を融合した音声認識
- Top-down音韻認識とBottom-up音韻認識を融合した音声認識 (音声認識)
- 音声認識における仮名・漢字文字連鎖確率に基づく統計的言語モデルの利用
- 単語グラフを用いた大語彙連続音声認識における近似演算法
- 大語彙連続音声確認のためのコンパクトな可変長n-gramモデル
- 単語グラフを用いた大語彙連続音声認識における近似演算手法の検討
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- 語彙制約なし音声認識における識別誤り最小化学習の検討
- 音響モデルのタスク適応における学習データに関する検討
- ICASSP'96会議報告
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 双方向網探索によるHMM文節音声認識系の評価
- N-best候補を用いた話題抽出の検討
- ニュース音声を対象とした連続音声認識に基づく話題抽出
- ニュース音声を対象とした大語彙連続音声認識と話題抽出
- 音声研究会報告 : 解説と展望
- 音響的コンテキストを考慮したセグメントモデルに基づく音声認識
- クラス言語モデルにおける初期クラスタの検討
- 大局的言語制約を考慮した可変長言語モデル
- 音素結合音響モデルの自由発話での効果
- Delayed Arc EvaluationによるLRパーザ制御に基づくViterbiサーチ
- 逐次クラスタ分割による統計的言語モデル構築法の検討
- 適応音響モデルを用いた放送ニュース音声認識
- ポース情報に基づいた動的探索制御法の検討
- 品詞および可変長単語列の複合N-gramの自動生成
- 係り受け規則と遷移規則を融合した規則により候補を限定した文節音声の認識 (新しい音声処理技術特集)
- 文節音声認識のための係り受けの整合性を考慮した横型解析