LK_011 Sound Source Localization for Multimedia Retrieval in a Ubiquitous Environment
スポンサーリンク
概要
- 論文の詳細を見る
We present a system for video retrieval based on analyzing audio data from a large number of microphones in a ubiquitous home. Silence elimination on individual microphones is followed by noise reduction based on regions consisting of multiple microphones, to identify audio segments. An algorithm based on the energy distribution of sounds in the house is used to localize sound sources, thereby removing sounds heard in regions other than they were generated. The algorithms were evaluated with 200 minutes of audio data from each of the microphones, gathered during an experiment during which a family lived in the ubiquitous home. It was possible to achieve an overall accuracy of above 80% from all algorithms.
- 2006-08-21
著者
関連論文
- 2-1 超高精細映像システム・コンテンツ(2.超高精細映像技術・立体映像技術,超臨場感コミュニケーションの近未来像)
- シルエット抽出とモデル生成の相互フィードバックによるTime-Varying Meshの高精度化(3次元再構成・多視点画像処理,画像の認識・理解論文)
- 画像の特徴抽出2 : Scale-Invariant Feature Transform (SIFT) と Bag of Features (BoF)
- ユーザの閲覧履歴を利用したライフログデータの要約
- 4.食べる(生活に役立つメディア処理-料理行動を科学する-)
- スケルトンによる Time-Varying Mesh の動き抽出と合成
- 3)代表動きベクトルの抽出に基づく超低レート符号化の検討(画像通信システム研究会)
- 8)一画素マッチングに基づく動き推定の基礎検討([画像通信システム研究会 画像応用研究会]合同)
- D-12-83 簡易スタジオでの背景処理にロバストなTime-Varying Mesh生成(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- モバイル端末でのTime-Varying Mesh表示のためのメッシュ処理(立体映像技術一般)
- Time-Varying Mesh の位相変化検出とインタラクティブなメッシュ編集
- 3次元映像の圧縮と処理(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 40分で書くHoG(First Person Visionのための認識・理解)
- セグメンテーション : GrowCut
- 1)多眼カメラを用いた高精細画像入力方式-水平・垂直解像度の異なる画像の合成による高解像度化-(画像通信システム研究会)
- 3.料理メディア : 台所におけるディジタルコンテンツの処理と利用(ディジタルコンテンツ制作の最新動向〜ここまで来たディジタルコンテンツ制作〜)
- 食事ログの取得と処理 : 画像処理による食事記録
- 食事画像の解析における特徴量選択の評価(ITS画像処理,映像メディア及び一般)
- 食事画像の解析における特徴量選択の評価(画像処理,ITS画像処理,映像メディア及び一般)
- 2)多重フレーム速度を用いる動き推定法 : コンピューテーショTILイメージセンサのための一検討(〔画像通信システム研究会 画像応用研究会〕会同)
- 2)新しい設計による動画像圧縮センサ(情報入力研究会)
- 3)動画像圧縮イメージセンサの検討(画像応用研究会)
- 自針と分針 : 映像からの人物抽出によるメディアアート(メディアアート,デジタルミュージアムとエンタテイメントメディア)
- The Shadow Man : 影を用いたインタラクティブ・メディア・アート(メディアアート,デジタルミュージアムとエンタテイメントメディア)
- モバイルやロボットに入り込む最先端画像処理 : ハードウェア化による高速化・低消費電力化の試み(Digital Harmonyを支えるプロセッサとDSP,画像処理の最先端)
- B-15-10 スケルトンを利用した異なるモデル間でのメッシュ変形(B-15.モバイルマルチメディア通信,一般セッション)
- 3X-7 スケルトンを用いた異なるメッシュモデル間の対応点抽出(3次元画像処理・認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- モバイルやロボットに入り込む最先端画像処理 : ハードウェア化による高速化・低消費電力化の試み(Digital Harmonyを支えるプロセッサとDSP,画像処理の最先端)
- モバイルやロボットに入り込む最先端画像処理 : ハードウェア化による高速化・低消費電力化の試み(Digital Harmonyを支えるプロセッサとDSP,画像処理の最先端)
- D-11-35 DPマッチングの経路制限による2次元動画をクエリとしたTVM検索の精度向上(D-11.画像工学,一般セッション)
- 1ZB-7 ウェアラブルカメラによる対人ログの取得と処理(ユビキタスデータ管理,学生セッション,ネットワーク,情報処理学会創立50周年記念)
- 勾配ベースの画像編集 : Poisson Image Editing
- I_035 無線LANマルチカメラサーベイランスシステムにおける帯域割り当てに関する検討(I分野:画像認識・メディア理解)
- 6Z-1 食事画像における類似画像検索(インタラクティブシステム,学生セッション,ネットワーク,情報処理学会創立50周年記念)
- 5G-4 ペン入力による動的な軌跡の描画に関するユーザビリティ評価(ユーザインタフェース,一般セッション,インタフェース,情報処理学会創立50周年記念)
- D-9-13 食事ログシステムの利用状況調査(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- 食事画像の解析における特徴量選択の評価(画像処理,ITS画像処理,映像メディア及び一般)
- 映像情報メディアの未来ビジョン
- WIDEプロジェクト代表に聞く
- 招待講演 屋内における人物行動の解析と記録:ライフログの観点から (第11回知能メカトロニクスワークショップ講演論文集)
- ライフログ--体験の情報処理
- 追跡によるセマンティックなオブジェクト抽出の手法
- D-12-10 Diffusion Based Region Growing for Color Image Segmentation
- DSPキットの講義での利用
- 「デジタル時代の公共放送に関する勉強会」報告書
- 2Y-8 食事ログに向けた画像処理による料理の味推定(物体認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 天井カメラ映像を用いた公共空間の人物属性解析 (パターン認識・メディア理解)
- I-010 Video2Manga : A Comic-like Video Summary
- 2ZD-5 全方位カメラによる参照画像を用いた屋内における位置推定 : デジタルミュージアムでの鑑賞者の行動記録に向けて(位置・コンテキスト推定(2),学生セッション,ネットワーク,情報処理学会創立50周年記念)
- 全方位カメラによる位置参照画像群を用いた屋内位置推定 : デジタルミュージアムでの鑑賞者の行動記録に向けて(デジタルミュージアム,デジタルミュージアムとエンタテイメントメディア)
- 座談会 21世紀の映像情報メディアはどうなるか?(2.21世紀の映像情報メディアはどうなるか)(創立50周年記念特集)
- 2)センサでの動き推定手法の検討(〔情報入力技術研究会 情報ディスプレイ研究会〕合同)
- 1)階層的動き推定とその滑らかさを考慮したフレーム内挿(〔画像通信システム研究会 画像応用研究会〕会同)
- 3Y-8 コメント解析によるCGM動画のシーン処理(線画像・画像検索・映像処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- H-050 Affective Analysis of Films by Low-Level Visual Features
- 10)動画像の階層構造表現のための構造情報の抽出(放送方式研究会)
- 3)ゼロ交差と付加情報を用いた画像信号の再構成とノイズ低減への応用(画像通信システム研究会)
- 7)センサ上での即時動きベクトル検出 : 方式と設計([情報入力研究会 情報ディスプレイ研究会]合同)
- D-12-120 加速度センサによるクエリを用いたモーションキャプチャデータの検索(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- 4V-2 Evaluation on Compressed Image Improving Technique by Blending Reference Image
- I-009 Attention-based Clustering for Grouping Photo Collections by Quality of Composition
- O-012 写真による対人ログデータからの親密度推定(O分野:情報システム,一般論文)
- H-034 公共空間における多人数追跡と属性解析(H分野:画像認識・メディア理解,一般論文)
- H-025 食事ログシステムの解析の個人への適応と検討(H分野:画像認識・メディア理解,一般論文)
- H-022 写実的レンダリングに向けたTime-Varying Meshの表面属性推定(H分野:画像認識・メディア理解,一般論文)
- 1ZB-1 汎用ライフログデータ取得のための携帯端末の開発(ユビキタスデータ管理,学生セッション,ネットワーク,情報処理学会創立50周年記念)
- 2Y-7 Histogram of Oriented Gradientsアルゴリズムのハードウェア実装に向けた検討(物体認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- I-039 An Evaluation Approach for Temporal Segmentation of 3D Videos
- 1P1-68-103 多重解像度イメージセンサの設計と試作
- 2)イメージセンサ面上での高速ブロックマッチングによる動き検出(情報センシング研究会)
- 6)画像信号の適応型離散コサイン変換Gain : Shapeベクトル量子化法(〔画像通信システム研究会(第75回)画像処理・画像応用研究会(第79回)〕合同)
- D-9-7 全方位カメラ画像を用いた博物館における展示物認識(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- H-004 ウェアラブルカメラを利用した展示会場での見学履歴取得(画像認識・メディア理解,一般論文)
- D-12-5 コメント数の動的な変化を利用したCGM動画要約(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- D-12-27 動き情報を用いた多視点画像から3D形状復元手法(D-12.パターン認識・メディア理解,一般セッション)
- A-16-8 衣服ログ : イベントとの連携によるコーディネート支援を目指して(A-16.マルチメディア・仮想環境基礎,一般セッション)
- D-12-28 信頼度に基づいた重み付きバンドル調整によるワイドベースライン画像の高精度デプスマップ推定(D-12.パターン認識・メディア理解,一般セッション)
- D-12-55 テクスチャ解析による食事画像の領域分割(D-12.パターン認識・メディア理解,一般セッション)
- D-12-54 食事ログにおける各個人の食事時刻と食傾向を利用した食事バランス推定(D-12.パターン認識・メディア理解,一般セッション)
- D-12-82 単眼動画像を用いた大きな姿勢変化を伴う運動の種別判定(D-12.パターン認識・メディア理解,一般セッション)
- デジタルコンテンツシンポジウムについて
- メディアと人
- 1.ライフログの実践的活用 : 食事ログからの展望(ライフログ)
- I_066 視覚情報に基づくWebページ閲覧履歴検索(I分野:画像認識・メディア理解)
- マルチメディア食事記録と画像処理による食事内容解析 (特集 食とコンピューティング)
- 1)柔軟なサンプリング制御を撮像面上で実現する新しいイメージンサ(情報センシング研究会)
- 5)サンプリング制御機構を搭載した新しいイメージセンサ(情報センシング研究会)
- 6)動画像圧縮センサ : 列並列処理構成による回路設計と試作([情報入力研究会 情報ディスプレイ研究会]合同)
- 3次元映像の圧縮と処理(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 3次元映像の圧縮と処理(システムLSIの応用と要素技術,プロセッサ,DSP,画像処理技術及び一般)
- 食と住のライフログ(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 食と住のライフログ(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 画像符号化シンポジウム(PCSJ'90)
- 5)画像列の統合による動物体の抽出とその映像合成への応用(放送方式研究会)
- 自己相似性に基づく準同一映像検出
- 自己相似性に基づく準同一映像検出
- LK_011 Sound Source Localization for Multimedia Retrieval in a Ubiquitous Environment
- 村井純 : WIDEプロジェクト代表に聞く(トップは語る)
- 1. デジタルコンテンツシンポジウムについて(ディジタルコンテンツ制作の最新動向 〜ここまで来たディジタルコンテンツ制作〜)
- 3-2. メディアと人(3. メディアと社会・人・そして,学会創立60周年記念 映像情報メディアの未来ビジョン)