正三角形型マイクロホンアレーと全方位カメラを用いた全方位マルチモーダル話者方位推定の検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)

スポンサーリンク

概要

論文の詳細を見る
本稿では,正三角形型マイクロホンアレーと全方位カメラを用いた全方位マルチモーダル話者方位推定法を提案する.提案手法は頑健な特徴量として,全方位に拡張したWCSP (Weighted Cross-power Spectrum Phase)法とCSP係数サブトラクションによって音響特徴量を,正規化距離に基づく背景差分法とT-S色平面における肌色検出法によって画像特徴量を抽出する.さらに,音響特徴量の信頼度に基づいて決定される重み係数を用いた特徴量の重み付き統合を行い,話者方位を推定する.実オフィス環境における評価実験の結果,提案する全方位マルチモーダル話者方位推定法は,音響/画像特徴量を単独で用いる従来手法よりも誤棄却率/誤検出率を改善できることが確認できた.
2007-01-18

著者

関連論文

もっと見る

スポンサーリンク