MPEG符号化データからのオーディオインデキシング
スポンサーリンク
概要
- 論文の詳細を見る
キーワードスポッティングやコンテンツベースのオーディオビジュアル検索システムにおいては動画像のショット切換り点の検出やオーディオ情報の自動分類が非常に重要な課題になる.本論文では, MPEG符号化データからオーディオ情報をサブバンド上で高速に分類する手法を提案する.まず無音区間をサブバンドエネルギーの分散を用いて検出し, 次に有音区間に対してサブバンドデータの時間的エネルギーの疎密度, 平均サブバンド数とサブバンド重心を用いて音楽, 音声, 歓声雑音の3種類のクラスに分類した.識別法としてはクラス数や識別条件が増加するに従い複雑になるしきい値法に代わってBayes決定における正規分布に対する最適識別関数を用いた.分類実験では, MPEGオーディオデータを1秒単位に分類し, 90%以上の精度で無音や音声区間を検出することができ, 検出処理はMPEGオーディオ復号処理時間の1/6以下で検出が可能になった.
- 2000-05-20
著者
関連論文
- 多段階の画質低下を実現するROI考慮型ビデオスクランブル
- D-11-69 ROI内の信号レベル制御を用いた多段階画質制御スクランブル(D-11.画像工学,一般セッション)
- H.264の符号領域における高速ダウンスケール手法(画像)
- I-046 ビデオサムネイルのマンガ風効率的配置法に関する一検討(グラフィクス・画像,一般論文)
- 輝度重心に基づくバイナリー特徴量の適応的照合による高速・高精度な同一映像検出 (画像符号化・映像メディア処理レター特集)
- 携帯端末上でのプロキシ編集(映像理論・映像システム,画像処理・符号化及び一般)
- 輝度重心に基づくバイナリー特徴量の適応的照合による高速・高精度な同一映像検出(研究速報,映像メディア処理,画像符号化・映像メディア処理レター)
- A-16-17 ライトによる色相変化特徴量を利用したネイルアートシミュレーション(A-16.マルチメディア・仮想環境基礎,一般セッション)
- D-12-19 アフィン不変領域抽出のためのSIFT拡張の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- 携帯電話のカメラワーク推定を利用した操作インタフェースの評価 : 3Dマップを用いた操作性評価(マルチメディア情報入力及び処理方式および一般)
- H.264のWeighted Predictionを利用した高速フェード編集方式(画像・映像処理)
- B-7-104 動画のエラー伝播特性を考慮した不均一誤り保護の一検討(B-7. 情報ネットワーク,一般セッション)
- D-11-12 H.264の重み予測と動き予測における係数推定の一検討(D-11. 画像工学,一般セッション)
- LI-003 H.264の重み予測を利用したネガポジ反転に関する一検討(グラフィクス・画像)
- LJ_010 H.264/MPEG4 AVCの重み予測を利用したフェード編集に関する一検討(J分野:グラフィクス・画像)
- LJ-003 映像コンテンツのエラー耐性に応じたBCMCSチャネル構成に関する一検討(J分野:グラフィクス・画像)
- LJ-010 H.264/MPEG-4 AVCの重み付き動き補償における高速重み係数推定の一検討(J. グラフィクス・画像)
- D-11-65 TV会議用マルチ画面変換におけるDCT領域での逆動き補償の検討(D-11.画像工学A)
- D-11-29 JPEG2000における歪み量指定型符号量制御方式に関する一検討(D-11.画像工学A(画像基礎・符号化),一般講演)
- D-11-2 階層型秘密分散法におけるデータサイズ削減方法に関する一検討(D-11.画像工学A(画像基礎・符号化),一般講演)
- D-14-16 立体音響知覚特性測定システムの構築と基礎実験(D-14.音声・聴覚,一般講演)
- 低レートテレビ配信のためのプリフィルタ制御方式
- 低レートテレビ配信のためのプリフィルタ制御方式(画像処理1, ITS画像処理,映像メディア及び一般)
- ブロードバンド・モバイルネットワークでの動画伝送・変換技術
- サッカー映像のシーンナビゲーションに関する検討
- D-12-48 主観評価を考慮した類似顔画像判定法に関する検討(D-12. パターン認識・メディア理解, 情報・システム2)
- 携帯電話音声に対する主観評価の精度及び客観評価尺度PESQの有効性の検証(一般)
- SMILを利用した大容量番組配信サービス : EZチャンネル
- SMILを利用した大容量番組配信サービス : EZチャンネル(モバイルマルチキャスト,ブロードキャスト,モバイル放送・マルチメディア配信,ディジタル放送受信機,及び一般)
- J-071 H.264/MPEG-4 AVCインター予測フレームにおける高速符号化手法(J.グラフィクス・画像)
- H.264符号化処理における符号化モード判定に関する一検討(映像メディア処理,感性情報工学及び一般)
- D-12-174 サッカー映像におけるシーン分類に関する検討(D-12. パターン認識・メディア理解B)
- D-12-166 MPEG圧縮された映画のショット分類とシーン分割(D-12. パターン認識・メディア理解B)
- D-12-55 蓄積容量の限られた顔画像認証装置における辞書更新法(D-12.パターン認識・メディア理解A)
- D-11-53 MPEGビデオのビットレート変換トランスコーダに関する一検討(D-11.画像工学A)
- SIFTを用いた都市環境の建物画像検索によるユーザ位置・方向推定手法に関する一検討(テーマセッション関連,一般物体認識・画像特徴量)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- D-12-20 SIFTに基づく建物画像マッチングに関する一検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-11-16 JPEG 2000タイルサイズ変換トランスコーダの高速化(D-11.画像工学A)
- JPEG 2000におけるタイルサイズ変換トランスコーダの検討
- JPEG 2000におけるタイルサイズ変換トランスコーダの検討(映像メディア及び一般)
- JPEG 2000におけるタイルサイズ変換トランスコーダの検討(映像メディア及び一般)
- D-11-20 JPEG2000 における離散ウェーブレット変換係数のタイルサイズ変換のための高速歪補正方式の検討
- 画像割符のための濃淡再現域への一意な階調変換法(画像)
- D-12-67 類似ショット検出を用いた野球映像からのハイライト抽出に関する検討
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- 高コントラスト割符・重畳画像生成のための自動階調変換法
- 高コントラスト割符・重畳画像生成のための自動階調変換法
- メディア符号化・伝送・表示
- I-023 任意の画質制御が可能なMPEGビデオスクランブル(グラフィクス・画像,一般論文)
- D-11-1 ドリフト補償を伴ったMPEGストリームへの直接電子透かし挿入方式(D-11.画像工学A)
- D-11-35 MPEG ストリームへの電子透かし埋め込みに関する一検討
- 1-8 携帯電話ビデオ配信用コンテンツ制作システムの開発 : テロップテキストフオーマット
- D-11-5 DV-MPEG 変換に伴う DCT 領域上でのリサイズについての検討
- 符号情報を利用したDVからMPEG-2への高速変換アルゴリズム(画像符号化・通信・ストリーム技術および一般)
- 符号情報を利用したDVからMPEG-2への高速変換アルゴリズム
- 符号情報を利用したDVからMPEG-2への高速変換アルゴリズム
- 符号情報を利用したDVからMPEG-2への高速変換アルゴリズム
- 低レートテレビ配信のためのプリフィルタ制御方式(画像処理1, ITS画像処理,映像メディア及び一般)
- H-042 Iフレームを用いたショット境界検出の高速化に関する性能評価(画像認識・メディア理解,一般論文)
- D-11-6 MPEG-4 ビデオの複数同時符号化方式に関する一検討 (I) : マルチビットレート出力に関する検討
- 特徴ベクトルを用いたMPEG1符号化データからのAudio情報の自動分類
- タイル化ウェーブレット変換画像符号化におけるタイルサイズ変換方式に関する基礎検討
- H.264のIntra予測残差に対する適応的変換基底関数を用いた映像符号化方式
- I-009 符号化コスト関数に基づくH.264/AVCフリッカ低減手法(I分野:グラフィクス・画像)
- H-053 建物画像検索のための特徴点選択手法の一検討(画像認識・メディア理解,一般論文)
- J_043 圧縮符号化情報を利用したHDTV映像の高速画面結合手法(J分野:グラフィクス・画像)
- J-073 グローバル動きを用いた高速動画像モザイキング手法(J分野:グラフィクス・画像)
- D-11-51 H.264符号化処理におけるIntra/Interモート゛判定に関する一検討(D-11.画像工学A)
- H.264符号化処理における動き予測の高速化に関する一検討
- QoS 保証型 MPEG-4べースライブ伝送システムの開発
- D-11-4 JVT と MPEG-4 ASP の動き補償の特性比較
- ニュース向け映像素材の蓄積伝送の効率化
- ニュース向け映像素材の蓄積伝送の効率化 (小特集 放送で活躍する新制作技術) -- (中継制作の新技術)
- B-7-78 奄美大島の離島遠隔医療実験におけるMPEG-4ライブ伝送
- D-11-7 MPEG-4 ビデオの複数同時符号化方式に関する一検討 (II) : マルチ解像度出力に関する検討
- 携帯電話によるビデオ配信向け高機能コンテンツ制作システム
- 携帯電話によるビデオ配信向け高機能コンテンツ制作システム
- 1-7 携帯電話ビデオ配信用コンテンツ制作システムの開発 : 編集方式
- 1-6 携帯電話ビデオ配信用コンテンツ制作システムの開発 : フォーマット変換方式
- 1-5 携帯電話ビデオ配信用コンテンツ制作システムの開発 : コンテンツフォーマット
- 1-4 携帯電話ビデオ配信用コンテンツ制作システムの開発 : 基本設計
- 携帯電話によるビデオ配信向け高機能コンテンツ制作システム
- DCT領域での多地点映像合成処理についての検討
- メディア符号化・伝送・表示
- WEBベースMPEGデータベースシステムの開発
- H.264のIntra予測残差に対する適応的変換基底関数を用いた映像符号化方式
- MPEG符号化データからのオーディオインデキシング
- 識別関数を用いたMPEGオーディオ情報の自動分類
- MPEG符号化データからのAudio情報の分類
- メディア符号化・伝送・表示
- 5-2 自然画像対応カラー割符方式における画素配置特性評価(第5部門 画像・映像処理2)
- 18-8 主観画質を制御可能な局所領域MPEGビデオスクランブルの検討(第18部門 符号化・セキュリティ)
- 10-2 ニュース取材の業務フローに適合した映像伝送システム(第10部門 放送技術(放送現業))
- 8-8 スマート端末を用いた同期型テキストコミュニケーション(第8部門コンピュータビジョン,ヒューマンインタフェース,その他)
- 2-6 制限時間内での蓄積型映像伝送のためのパラメータ制御手法(第2部門 放送現業)
- 7-9 楽曲スライドショー オンザフライシステムの構築(第7部門 メディア工学2)
- 9-9 楽曲スライドショーシステムの主観評価報告 : スライドショーの品質向上に向けて(第9部門ヒューマンインフォメーション)
- 9-1 高齢者によるスマートフォンのユーザビリティ評価(第9部門 ヒューマンインフォメーション)