ニュース音声を対象とした言語モデルと話題抽出の検討

スポンサーリンク

概要

論文の詳細を見る
放送ニュース音声のディクテーションと、それに基づく話題抽出に関する検討結果について報告する。単語の読みの多様性に対処するため、読みの確率をスコアに含む方法を提案する。未知語の問題に対処するため、その読みをあらかじめ新語として登録し、言語モデルには未知語のモデルを用いる方法を提案する。高次の統計的言語モデルとして、単語の頻度と分類語彙表を用いたクラス4グラムを検討し、余剰語への対処法についても検討する。次に、ニュース音声から、単語の相対出現頻度に基づいて話題語を抽出する方法を検討する。ディクテーションでは、anchor setに対して83.2%の単語正解精度が得られ、各ニュースから5個の話題語を抽出する場合、82.8%のprecisionが得られる。
社団法人電子情報通信学会の論文
1998-06-12

著者

関連論文

もっと見る

スポンサーリンク