マイクロホンアレーを用いた話者位置推定による車載音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,マイクロホンアレーを用いた話者位置推定による車載音声認識の方法を提案する.まず,マイクロホンアレーを2次元的に配置する.次にマイクロホンアレーからの入力信号に対して,HE(Harmonic Enhanced)2-D MUSIC(MUltiple SIgnal Classification)法を適用する.ここで提案するHE 2-D MUSIC法は,波の到来方向推定法であるMUSIC法[11]を2次元に拡張するとともに,調波構造を利用して人間の音声と雑音を識別する手法である。また,2次元に拡張した遅延和アレーを用いて,推定された話者位置にビームを向けることで音声強調を行う,これらの手法によって,話者位置から到来する音声成分の強調が実現される.強調された音声信号を音声認織部の入力とすることにより,自動車内での雑音がある状況下において,どの座席の話者に対しても高性能な音声認識が可能となる.計算機シミュレーションにおける実験結果及び実車走行時の音声に対する実験結果を示し,提案方法の有効性を明らかにする.
- 社団法人電子情報通信学会の論文
- 2002-07-01
著者
-
金子 正秀
電気通信大学大学院電気通信学研究科
-
近藤 啓介
電気通信大学大学院電気通信学研究科電子工学専攻
-
榑松 明
電気通信大学電子工学専攻
-
榑松 明
電気通信大学 電子工学科
-
長井 隆行
電気通信大学
-
金子 正秀
電気通信大学
関連論文
- 周囲歩行者の状態推定により動的環境に柔軟に対処可能な自律移動ロボット(学生研究発表会)
- 顔特徴点位置の統計的性質を利用した顔部品形状の抽出精度向上と似顔絵作成(学生研究発表会)
- 顔特徴の言葉による記述と類似顔検索への応用(学生研究発表会)
- 印象語から想起した音声情報の特徴量空間の分析
- J-028 音声対話システム利用時における感情表出誘因性に関する考察(ヒューマンコミュニケーション&インタラクション,一般論文)
- 固有空間法による似顔絵の表情生成技術を応用した携帯電話向け電子メーラの試作(チュートリアル)
- 顔面の肌色解析による交感神経系活性度の非侵襲的評価(マルチメディア処理)
- 表情の変換規則と画家の描画スタイルの学習に基づく表現力のある似顔絵の生成(学生研究発表会)
- 顔情報処理の研究あれこれ(学生研究発表会)
- 顔パーツの形状と配置に対するテンプレートの自動選択による似顔絵生成(学生研究発表会)
- 顔画像情報処理の研究の拡がり(フェロー受賞記念講演,移動カメラ画像処理におけるパターン認識とメディア理解)
- 6.コンピュータ似顔絵(いま"顔"が面白い〜顔の画像処理とその応用〜)
- 顔特徴点位置の統計的性質を利用した顔部品形状の抽出精度向上と似顔絵作成
- 周囲歩行者の状態推定により動的環境に柔軟に対処可能な自律移動ロボット
- オクルージョンに頑健な視覚追跡技術--見えないものを推測できるロボットビジョンの実現を目指して (まるまる! ロボットビジョン)
- 自律移動ロボットによる動的環境の認識(学生研究発表会)
- マイクロホンアレーを用いた複数種音源位置推定及び種別判定(学生研究発表会)
- 撮影条件の違いにロバストなまばたき検出を利用したベストショット画像の自動生成
- 撮影条件の違いに対応可能なまばたき検出を利用したベストショット画像の自動生成(画像処理・符号化とアプリケーション)
- J-049 対向者の歩行動作の観測と予測に基づくロボットの自律的すれ違い(ヒューマンコミュニケーション&インタラクション,一般論文)
- H-048 動作を表す言葉の語義に従った観測動作の分解に基づく日常生活での人物動作認識(画像認識・メディア理解,一般論文)
- D-12-34 SIFT特徴量を利用した頭部モデルによる人物視界推定(D-12. パターン認識・メディア理解,一般セッション)
- A-14-13 顔部品の形状特徴と配置の型を考慮した類似顔検索(A-14. ヒューマンコミュニケーション基礎,一般セッション)
- 形状と配置の特徴及び全体的な印象を考慮した類似顔検索 (メディア工学・学生研究発表会)
- 全周方向での音源位置推定及び肌色情報との統合による話者位置推定への適用(マルチメディア応用,画像の認識・理解論文)
- 画像情報に基づき自律的にユーザとの並走・縦走の切替えが可能なロボットの実現(映像符号化,システム及び一般)
- 解像度の違いにロバストなまばたき検出を利用したベストショット画像の自動生成(映像符号化,システム及び一般)
- 階層的分類手法を利用した顔印象語と顔部品形状との対応付け(映像符号化,システム及び一般)
- ロボットによる発話理解過程に基づく相互信念の形成
- 人間共存型ロボットへの画像認識モジュールの応用
- オブジェクトとの関係における拘束を考慮した人物動作の理解(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- オブジェクトとの関係における拘束を考慮した人物動作の理解
- I-074 Understanding Concurrent Activities of Human in Daily Lives by Hierarchical Interpretation of Each Body Part
- 2001年映像情報メディア学会冬季大会報告
- ロボットによる発話理解過程に基づく相互信念の形成
- 印象空間における音声と文字の対応関係の分析
- ベイジアンネットワークに基づく視聴覚情報の統合を用いた画像からの3次元音源位置推定
- 室内監視画像からの物体検出と移動履歴管理--2台のズーム機能付きカメラによる時系列画像を用いた室内監視 (特集 最新の監視システム--セキュリティショー2004)
- A-4-12 周波数選択特性を有する荷重メジアンフィルタによるボケと雑音で劣化した画像の復元
- 室内監視画像からの物体領域の検出と移動履歴の管理(画像処理)
- 会話シーンにおけるロボットと複数ユーザとの共同注意の形成(画像処理)
- 顔姿勢推定に基づくユーザとロボットとの共同注意の形成
- 固有空間法による顔特徴の解析と似顔絵の生成(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- D-12-108 シーン内に置かれた物体の室内時系列画像からの検出
- 曖昧さを含んだ時空間指示によるコンピュータとの知的インタラクション
- 顔動画像のインタラクティブ知的符号化におけるローカル動き検出と眼鏡画像処理
- 眼鏡を含む顔画像からの構成部品の抽出
- I-66 サブバンドEHMMを用いた低解像度文字画像の高解像度化(画像高解像度化・劣化復元,I.画像認識・メディア理解)
- 頭部伝達関数を利用したロボットによる音源定位能力の自律的な獲得(一般セッション(7))(ユビキタスコンピューティングのためのパターン認識・理解)
- A-10-17 頭部伝達関数を利用したロボットによる音源定位能力の自律的な獲得(A-10. 応用音響)
- 5Y-8 周囲の複数歩行者の動きに応じて安全に自律移動するロボット(ロボットビジョン,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- K-059 Interpretation of Emotional Gestures by Considering Hands Positions and Face Features
- 4Y-7 顔特徴点位置の統計的性質を利用した顔部品形状の抽出精度向上(顔・人物画像処理(2),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 情景画像中の文字及び看板領域の抽出
- 情景画像中の文字及び看板領域の抽出
- 情景画像中の文字及び看板領域の抽出
- 顔のワイヤフレームモデルの自動適合の一手法
- 全周方向での音源位置推定および肌色情報との統合による話者位置推定への適用(メディア処理・コンテンツ生成,ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 1D-3 Occlusion, Expression and Illumination Invariant Face Recognition Using Block-based Bag of Words
- 6C-1 動的環境における動領域・静止領域の認識に基づく自律移動ロボットの自己位置推定(画像認識応用,一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- D-12-94 動領域・静止領域の確率的マッピングによる動物体追跡(D-12.パターン認識・メディア理解,一般セッション)
- J-1 周波数選択特性を有する荷重メジアンフィルタによる雑音で劣化した画像の復元(画像処理1,J.グラフィクス・画像)
- 固有空間を利用した計算機による似顔絵の生成
- MPEG符号化されたサッカー映像に対するシーンの自動分類のための情報抽出(映像情報の検索技術と編集処理)
- 1-6 MPEG符号化データを利用したサッカー映像の自動分類
- 顔部品の形状特徴と配置特徴の強調による似顔絵の生成
- 23-8 固有空間を利用した似顔絵の自動生成
- SA-7-1 固有空間の切換えによる異なる画調の似顔絵の生成
- 情景画像からの看板領域および看板文字の自動抽出(画像処理)
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- SD-2-4 2次元MUSIC法による話者位置推定を用いた車載音声認識
- 車載音声認識のための2次元MUSIC法を用いた話者位置推定
- 複数の異なるモダリティ情報の統合に基づく移動ロボットの行動選択
- 視聴覚情報の統合による音源の3次元位置推定と移動追跡(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- K-22 ユーザとロボットとのインタラクションにおける共同注意の形成手法(ヒューマン情報処理(1),K.ヒューマンコミュニケーション&インタラクション)
- 顔特徴の印象表現に対する定量的分析と入力顔判別への応用(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- D-12-89 まばたき検出に基づくベストショットの選択及び加工(D-12. パターン認識・メディア理解, 情報・システム2)
- 見掛けの特徴に基づくオブジェクトとの関係に着目した人物動作の解釈(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 屋内外の情景画像を対象とした看板文字の自動抽出
- D-12-23 情景画像からの情報取得を目的とした看板文字の自動認識
- 人間型ロボットとユーザとの間での顔アクションに基づく共感と反応(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 複数人物が任意の向きで着席した室内における挙手動作認識(学生研究発表会)
- 自律移動ロボットにおける視野外の状況も考慮した衝突回避 : 音情報による物陰の人物の認識(学生研究発表会)
- A-16-3 聞き手の立ち位置関係を調節するロボット(A-16.マルチメディア・仮想環境基礎,一般セッション)
- 人間型ロボットとユーザとの間での顔アクションに基づく共感と反応
- D-12-40 Motion Detection using Omni-Directional Camera Mounted on Moving Platform(D-12. パターン認識・メディア理解, 情報・システム2)
- ユーザからの曖昧さを伴った指示に基づく実環境内のオブジェクトの探索(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 屋内外の情景画像を対象とした看板文字の自動抽出
- 1-5 情景画像中の看板領域の抽出
- 6-2 オンライン物体モデリングを用いた遮蔽環境下での視覚追跡(第6部門 メディア処理3)
- 6-3 ロボットによる複数人の動きの観測に基づく並走・縦走の自律的切替え(第6部門 メディア処理3)
- 2-6 動領域・静止領域の確率的マッピングによる周囲環境の変化の検出(第2部門 メディア処理2)
- 1-6 顔特徴の解析と言葉による記述(第1部門 メディア処理1)
- 5-2 SIFT記述子を用いたASMによる顔特徴位置の推定(第5部門 メディア処理2)
- 8-9 独立成分分析を用いた顔特徴の解析と似顔絵生成システムへの応用(第8部門 画像認識・検索)
- 8-8 顔印象の定量的記述と類似顔検索への応用(第8部門 画像認識・検索)
- 4-2 動的環境に対する動・静止領域の確率的マッピングを用いた移動ロボットの自己位置推定(第4部門 メディア処理2)