識別関数を用いたMPEGオーディオ情報の自動分類

スポンサーリンク

概要

論文の詳細を見る
キーワードスポッティングやコンテンツベースオーディオビジュアル検索システムにおいてオーディオ情報の自動分類が非常に重要な課題になる。本稿では、MPEG符号化データから自動的にオーディオ情報を高速かつ高い精度で分類する手法を提案する。まず各種の録音状況に依存しない無音区間について述べる。次に、有音区間を音楽、音声そして歓声雑音3種類のクラスに分けて、MPEGオーディオのサブバンドデータに基づいた時間的エネルギーの疎密度、平均サブバンド数とサブバンド重心によって分類を行なう。さまざまな種類のオーディオソースに対応するために、本稿では閾値処理の代わりにBayes決定における正規分布に対する最適識別関数を用いた。分類実験では、MPEGオーディオデータが1秒単位で分類され、95%以上の無音と音声区間を正確に検出できた。また検出に必要な処理時間はMPEGオーディオ復号の処理時間の20%以下で検出が可能になった。
1998-11-20

著者

関連論文

もっと見る

スポンサーリンク