クラス統計と単語統計の併用による小規模学習データのための統計的言語モデル構成法
スポンサーリンク
概要
- 論文の詳細を見る
エントロピーを基準として自動的にクラスタリングされたクラス情報を用いたクラスbigramと単語bigramを、先行単語のunigram頻度の関数として表される重みを用いて、融合することによって、少量の学習データからでも精度と信頼性を保つことのできる頑健な言語モデルを構築することを試みた。新聞記事読み上げ文の認織実験の結果、学習データ量40000文での融合bigram(認識率82.01%)が、学習データ量100000文での単語bigram (認織率82.11%)に相当することがわかった。また、学習データが少量しかないスポーツニュースでの会話文を学習データとした場合、単語bigramと比較してクラスbigramで最大4.2ポイント、融合bigramで最大5.5ポイントの認識率が向上した。
- 一般社団法人情報処理学会の論文
- 1999-05-28
著者
関連論文
- 音声認識実用化技術の展開(総合報告)
- 複数情報の統合による人物の性別・年齢層の推定法(顔とジェスチャの認識)
- クラス距離を重みとする局所保存射影とその顔画像による年齢推定への応用(テーマ関連セッション2)
- 会話ロボットとその聴覚機能
- 音声シフト : 音高の意図的な変化を利用した音声入力インタフェース(音声, 聴覚)
- 音声シフト : "SHIFT"on Speech
- I-062 監視カメラ映像からの実時間顔検出手法の一検討(I.画像認識・メディア理解)
- 複数情報の統合による人物の性別・年齢層の推定法
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 集合知に基づく語彙情報を用いたトピック依存言語モデリング(理解)