キーワードスポッティングによるニュース音声の索引付けと分類

概要

論文の詳細を見る
オン・デマンドに基づくニュース・システム(ODN)を検討している。このシステムでは、希望する情報だけを取り出すことのできるニュースデータベースを構築しておく必要がある。そのためには、ニュースに対する索引付けや内容による分類を、人手ではなく自動化して行なう必要がある。ニュースは、内容を伝える音声、内容をまとめる文字、状況を伝える映像といったメディアで構成されているので、ニュース音声から索引付けや分類のためのキーワードを抽出する処理が必要不可欠となる。この点から今回、ニュース音声の記事分類と索引付けを行なった。記事分類では、単語スポッティングによりキャスターの音声からキーワード列とその存在確率を取り出す。キーワード毎に10分野の分類に対する寄与率を求めておき、この寄与率とキーワードの存在確率をもとに、確率的にニュース記事を分類する。本報告では、単語スポッティングの比較、キーワードの存在確率と寄与率の計算方法、索引付けの方法について述べる。
社団法人電子情報通信学会の論文
1996-11-15