接続の方向性を考慮した多重クラス複合N-gram言語モデル
スポンサーリンク
概要
- 論文の詳細を見る
クラス2-gramにおける効率的なクラス分類を実際のコーパスから統計的に行うための手法を提案する。本手法では直前および、直後の単語への接続性を別の属性としてとらえ、各単語に対してその属性ごとに複数のクラスを割り当てる。これらのクラスは前後に接続している単語の分布に基づいて各々独立に作成されることによって、効率的でかつ信頼性の高いクラス分類となっている。さらにこの多重クラス2-gramを結合単語との多重複合N-gramに拡張することにより、千分の一以下の論理パラメーターサイズでパープレキシティ、単語認識率ともに単語N-gramを上回る性能を示した。
- 一般社団法人電子情報通信学会の論文
- 1998-12-10
著者
関連論文
- 統計的翻訳評価尺度に基づく日英翻訳文の訳質分析(機械翻訳)
- 未知固有表現を含む音声の認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 連続音声認識システムにおけるfactoringテーブルのコンパクト化と不要単語仮説のガーベジコレクション
- 機械翻訳によって生成された追加テキストを使った統計的言語モデルの適応
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- 文認識率の向上に向けたFSAとNGRAMの併用モデルによる大語彙連続音声認識
- ROVER法を用いた音声認識結果の統合と誤認識文のリジェクション
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 話題と文型の違いを同時に考慮した言語モデル適応