マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
スポンサーリンク
概要
- 論文の詳細を見る
マイクロホンアレイとカメラアレイで収録した会議録を, ステレオヘッドホンで再生するシステムを構築した.このシステムは, 各話者の音像を, カメラアレイで収録した映像の発話者の位置関係が分かるように再生する.こうすることで, 話者の交代を知覚することができ, 受聴者が会議の内容を把握する助けとなる.本稿では, 会議録再生システムについて述べ, その動作を, 簡単な聴覚実験により確認した.
- 社団法人電子情報通信学会の論文
- 2005-08-12
著者
-
浅野 太
産業技術総合研究所
-
北脇 信彦
筑波大学大学院
-
山田 武志
筑波大学大学院
-
山田 武志
筑波大学大学院システム情報工学研究科
-
宮内 淳一
筑波大学大学院理工学研究科
-
北脇 信彦
筑波大 電子・情報工学系
-
浅野 太
産業技術総合研 情報技術研究部門
-
北脇 信彦
NTT電気通信研究所
関連論文
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 楽音と音声の双方に適用できる客観品質推定尺度の検討(ワイヤレス環境でのアプリケーション品質,P2P/アドホックネットワーク,画像符号化ストリーム技術,信頼性,一般)
- IP電話における中国・日本・欧米のMOS評価特性の比較(五感メディア,映像/音声サービスの品質,ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,仮想空間におけるユーザコミュニケーション,一般)
- ブラインド信号処理の最近の動向 : 超指数法と固有ベクトル法(ブラインド信号処理の技術とその応用論文)
- 一般化固有値展開を用いたセミブラインド音源分離
- B-11-1 IP網における音声の客観品質評価に用いる擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 視聴覚センサ情報の統合による音源追跡
- マイクロホンアレイとカメラアレイを用いた会議録コンテンツ作成システムについて
- ロボットにおける音源位置推定(ロボットにおける音響技術)
- 多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- パーティクルフィルタを用いた移動音源の追跡技術
- マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
- ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 音を分ける
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- A-19-8 タッチパネルのための音像定位インタフェースの検討(A-19.福祉情報工学,一般セッション)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- マイクロフォンアレイを用いた音環境の見守りによる非日常音と危険状態の検出システム(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- Q&Aコーナー(コーヒーブレーク)
- コヒーレントサブスペース法を用いたアレイ信号処理による音声強調
- B-11-2 雑音抑圧音声の総合品質推定モデルを適用したフルリファレンス客観品質評価法(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-11 時間離散ひずみの評価を考慮した擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-12 中国と日本のMOS評価特性の比較(B-11.コミュニケーションクオリティ,一般セッション)
- BS-8-3 雑音抑圧音声の品質推定モデルを用いたノンリファレンス客観品質評価法(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- BS-8-4 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- D-14-7 ETSI標準雑音抑圧フロントエンドのための雑音推定法の検討(D-14. 音声,一般セッション)
- 雑音抑圧音声の品質推定モデルとそのノンリファレンス客観品質評価への適用(NW管理,次世代NWアーキテクチャ,次世代NWのオペレーションアーキテクチャ,トラヒック計測・モデリング・品質,オーバレイネットワーク,次世代NWサービス品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 装置劣化要因の品質評価に用いるテスト信号の検討(五感メディア,映像/音声サービスの品質,有線無線ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,一般)
- 認識対象語彙数を考慮した雑音下孤立単語認識の性能推定(耐雑音性)
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
- HMMとMFCCを用いた楽器音の音源同定の検討
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
- 音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト
- 話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
- SVMを用いた音源数推定の音源分離システムへの応用
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 音源分離におけるSVMを用いた音源数推定法について
- 音源分離におけるSVMを用いた音源数推定法について
- Kirchhoff-Helmholtz 積分方程式に着目した状態フィードバック制御による反射音抑圧手法の提案
- ブラインド信号分離における音源数推定法について
- 符号化音声の客観品質評価に用いる擬似音声の有効性
- 残留エコー特性の客観測定に用いるテスト信号の比較
- 楽音波形の折れ線近似に基づくVariable bit-rate符号化の一検討
- 帯域とビットレートを考慮した楽音符号化品質設計法
- 3. ICAによる音響信号の分離(見分ける,聞き分ける)
- 実音響環境における音響シーンデータの収集
- D-14-36 RWCP実環境音声・音響データベース
- 実環境における音響シーンデータベースの構築
- B-11-12 QoE評価に用いる標準音声データベースとその特徴量の分析(B-11. コミュニケーションクオリティ,一般セッション)
- BT-1-3 超高速インターネット衛星WINDS「きずな」を用いたアジアの大学との遠隔教育実験(BT-1.新たな衛星利用、衛星応用,チュートリアルセッション,ソサイエティ企画)
- IP電話の通話音質評価(音響配信及び通信における音質変化とその評価)
- 音メディア通信サービスの未来を読む
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- 一般化固有値展開を用いたセミブラインド音源分離
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 楽音波形の折れ線近似 Variable bit-rate 符号化方式の適応量子化による品質改善
- B-11-35 平均非対称妨害密度を用いたI_の算出(B-11. コミュニケーションクオリティ, 通信2)
- 音声と非音声の識別処理に基づく定常雑音抑圧方式
- 高次Cumulantを用いたアレイ信号処理
- 近頃, 思うこと
- サブスペース法に基づいたアレイ信号処理による音声強調手法
- 分割構造を持つGriffiths-Jim型適応ビームフォーマについて
- RLS適応ビームフォーマの実装に関する検討
- D-14-16 フレーム正規化対数尤度に基づく信頼度を用いた単語レベルの認識結果の統合(D-14. 音声・聴覚, 情報・システム1)
- B-11-19 未知広帯域音声codecの符号化歪み指標Ie,wb算出法に関する一検討(B-11.コミュニケーションクオリティ,一般講演)
- 雑音抑圧処理音声に対する人間の認識率の検討及びPESQを用いた客観推定(ブロードバンドと放送のコンテンツ/セキュリティ/信頼性/モバイル, 及び一般)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)