実音響環境における音響シーンデータの収集
スポンサーリンク
概要
- 論文の詳細を見る
This paper describes a sound scene database necessary for studies such as sound source localization, sound retrieval, sound recognition and speech recognition in real acoustical environments. Many speech databases have been collected for speech recognition so far. The statistical modeling of speech based on the collected speech databases realizes a drastic improvement of speech recognition performance. However, there are only a few databases available for sound scene data including non-speech sound in real environments. A sound scene database is obviously necessary for studies of acoustical signal processing and sound recognition. This paper reports on d project for collection of the sound scene database supported by Real World Computing Partnership (RWCP). There are many kinds of sound scenes in real environments. The sound scene is denoted by sound sources and room acoustics. The number of combination of the sound sources, source positions and rooms is huge in real acoustical environments. Two approaches are taken to build the sound scene database in the early stage of the project. The first approach is to collect isolated sound sources of many kinds of non-speech sounds and speech sounds. The second approach is to collect impulse responses in various acoustical environments. The sound in the collected environments can be simulated by convolution of the isolated sound sources and impulse responses. In a later stage, the sound scene data in real acoustical environments is planned to be collected using a three dimensional microphone array. In this paper, the plan and progress of our sound scene database project are described.
- 社団法人日本音響学会の論文
著者
-
浅野 太
産業技術総合研究所
-
遠藤 隆
新情報処理開発機構
-
遠藤 隆
(株)日立製作所
-
遠藤 隆
Real World Computing Partnership
-
中村 哲
Nara Institute of Science and Technology
-
比屋根 一雄
Mitsubishi Research Institute
-
浅野 太
Electrotechnical Laboratory
関連論文
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- マルチモーダルヒューマンインタフェースのノートパソコンへの実装
- マルチモーダルヒューマンインタフェースのノートパソコンへ実装
- ブラインド信号処理の最近の動向 : 超指数法と固有ベクトル法(ブラインド信号処理の技術とその応用論文)
- 一般化固有値展開を用いたセミブラインド音源分離
- RSA暗号の電力解析法による攻撃とその対策(情報セキュリティ基礎)
- RSA暗号の電力解析法による攻撃とその対策
- 中国人剰余定理を用いた耐タンパーRSA暗号処理方式(情報セキュリティ基礎)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 視聴覚センサ情報の統合による音源追跡
- マイクロホンアレイとカメラアレイを用いた会議録コンテンツ作成システムについて
- ロボットにおける音源位置推定(ロボットにおける音響技術)
- 多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- パーティクルフィルタを用いた移動音源の追跡技術
- マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
- ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 音を分ける
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- CHES 2002 会議報告
- CHES2002会議報告
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 時系列データからのネットワークモデルの教師なし学習方式 : Incremental Path Methodの提案
- 動画像の自己組織化ネットワークによるモデル化とその動的特徴の可視化 : Video Intra-structure Visualization
- 動画像の自己組織化ネットワークによるモデル化とその動的特徴の可視化 : Video Intra-structure Visualization
- 動画像の自己組織化ネットワークによるモデル化とその動的特徴の可視化 : Video Intra-structure Visualization
- 音声波形からの音素片記号列を用いた音声要約と話題要約の検討
- 音声波形からの音素片記号系列を用いた音声要約と話題要約の検討
- 音声波形からの音素片記号系列を用いた音声要約と話題要約の検討
- 音声波形からの音素片認識記号系列を用いた話題要約方式の提案
- マイクロフォンアレイを用いた音環境の見守りによる非日常音と危険状態の検出システム(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- Q&Aコーナー(コーヒーブレーク)
- コヒーレントサブスペース法を用いたアレイ信号処理による音声強調
- 1チップマイコンを用いた音声合成カードの開発
- AS-3-6 論理シミュレータを用いた電力解析に対する脆弱性の原因信号線探索法(AS-3.将来ライフを拓くユビキタス技術(1)-RFID(ICカード・ICタグ)技術-,シンポジウム)
- 身振りと発話のマルチモーダルデータベース
- 音声によるテキスト検索について
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
- 音声データからの文書検索向けユーザモデルの自動獲得
- タスク実行対話の単語時系列からのネットワーク表現タスクモデルの自動獲得方式
- 知的対話のためのマルチモーダル・タスクモデルの自動作成 (セッション3:情報統合)
- 音声データの自己組織化と音声検索システム
- マルチモーダルインタフェース
- 音声と動画像の自己組織化ネットワークによるデータ表現とスポッティング相互検索
- 音声の自己組織化ネットワークモデルとスポッティング認識
- 大規模Bigram-netの空間クラスタリングとそのテキスト検索への応用 : Bigram-net Galactic Spatialization
- ジェスチャ動画像の自己組織化ネットワークによるモデル化と要素動作の自動抽出
- 音声・話題要約における話題の分節の検討
- 音声検索による音声認識へのアプローチ
- マイクロフォンアレイを用いたCSCW用音声認識モジュール
- 音声検索に基づく連続音声認識
- マイクロフォンアレイを用いたCSCW向け音声認識モジュール : アクティブマイクロフォン
- RIFCDPにおける方向性パターンを用いた特徴量の削減
- リファレンスの動的置換によるリアルタイムワードスポッティング
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
- 音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト
- 話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
- SVMを用いた音源数推定の音源分離システムへの応用
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 音源分離におけるSVMを用いた音源数推定法について
- 音源分離におけるSVMを用いた音源数推定法について
- Kirchhoff-Helmholtz 積分方程式に着目した状態フィードバック制御による反射音抑圧手法の提案
- ブラインド信号分離における音源数推定法について
- 符号化音声の客観品質評価に用いる擬似音声の有効性
- 残留エコー特性の客観測定に用いるテスト信号の比較
- 楽音波形の折れ線近似に基づくVariable bit-rate符号化の一検討
- 帯域とビットレートを考慮した楽音符号化品質設計法
- 3. ICAによる音響信号の分離(見分ける,聞き分ける)
- 実音響環境における音響シーンデータの収集
- D-14-36 RWCP実環境音声・音響データベース
- 実環境における音響シーンデータベースの構築
- 一般化固有値展開を用いたセミブラインド音源分離
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 楽音波形の折れ線近似 Variable bit-rate 符号化方式の適応量子化による品質改善
- 高次Cumulantを用いたアレイ信号処理
- 近頃, 思うこと
- サブスペース法に基づいたアレイ信号処理による音声強調手法
- 分割構造を持つGriffiths-Jim型適応ビームフォーマについて
- RLS適応ビームフォーマの実装に関する検討