顔画像を用いた個人識別による話者適応型音声認識手法(話者・分析・合成,認識,理解,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
話者適応型音声認識では,話し手の音声を用いる話者認識を行うのが一般的である.特に,実環境においては,話者の交代に迅速に適応することが求められる.本稿では,話し手を特定する個人識別を,顔画像を用いて行う方法を提案する.これにより,音声を用いるよりも,早い個人識別が可能となるとともに,音声認識対象者が話し始める前に,事前に作成した音響モデルを切り替えることができ,話し始めのフレーズにも話者に適応する.
- 一般社団法人電子情報通信学会の論文
- 2012-07-12
著者
関連論文
- ARToolKitを用いた拡張現実による3D-CGモデリングツール構築のための一検討(感性とメディア及び一般)
- SURFを用いた View-Based Navigation による位置分解能の向上
- 複数人体のモーションキャプチャにおけるFLSMに基づいたオクルージョン領域の人体形状推定手法 (パターン認識・メディア理解)
- プロジェクタと単眼Webカメラを用いた手の3次元操作による投影型インタフェースの開発 (画像工学)
- プロジェクタと単眼Webカメラを用いた手の3次元操作による投影型インタフェースの開発 (ITS)
- 現実物体と仮想物体のインタラクションを考慮したARに基づく情報提示装置の開発 (画像工学)
- 現実物体と仮想物体のインタラクションを考慮したARに基づく情報提示装置の開発 (ITS)
- 人体構造を考慮したパーティクルフィルタを用いた単眼カメラによる3次元リアルタイムモーションキャプチャ (画像工学)
- 人体構造を考慮したパーティクルフィルタを用いた単眼カメラによる3次元リアルタイムモーションキャプチャ (ITS)
- SURFを用いたView Based Navigationの位置精度の向上 (画像工学)
- SURFを用いたView Based Navigationの位置精度の向上 (ITS)
- 動的環境における運動パラメータの投票処理を用いた運動推定手法の検討 (ヒューマン情報処理)
- 動的環境における運動パラメータの投票処理を用いた運動推定手法の検討 (ヒューマンコミュニケーション基礎)
- プロジェクタと単眼Webカメラを用いた手の3次元操作による投影型インタフェースの開発(ITS画像処理,映像メディア,視覚及び一般)
- 現実物体と仮想物体のインタラクションを考慮したARに基づく情報提示装置の開発(ITS画像処理,映像メディア,視覚及び一般)
- 人体構造を考慮したパーティクルフィルタを用いた単眼カメラによる3次元リアルタイムモーションキャプチャ(ITS画像処理,映像メディア,視覚及び一般)
- SURFを用いたView Based Navigationの位置分解能の向上(ITS画像処理,映像メディア,視覚及び一般)
- 教示画像と入力画像間の運動パラメータを用いた移動ロボットの位置・方向推定に関する研究
- 色相ヒストグラムに基づく不変特徴を用いた画像中のオブジェクト検出
- SURFを用いたView Based Navigationの位置分解能の向上(ITS画像処理,映像メディア,視覚及び一般)
- SURFを用いたView Based Navigationの位置分解能の向上(ITS画像処理,映像メディア,視覚及び一般)
- プロジェクタと単眼Webカメラを用いた手の3次元操作による投影型インタフェースの開発(ITS画像処理,映像メディア,視覚及び一般)
- プロジェクタと単眼Webカメラを用いた手の3次元操作による投影型インタフェースの開発(ITS画像処理,映像メディア,視覚及び一般)
- 動的環境における運動パラメータの投票処理を用いた運動推定手法の検討(コミュニケーション支援,一般)
- 動的環境における運動パラメータの投票処理を用いた運動推定手法の検討(コミュニケーション支援,一般)
- プロジェクタと単眼 Web カメラを用いた手の3次元操作による投影型インタフェースの開発
- 人体構造を考慮したパーティクルフィルタを用いた単眼カメラによる3次元リアルタイムモーションキャプチャ
- 現実物体と仮想物体のインタラクションを考慮したARに基つぐ情報提示装置の開発
- SURFを用いた View Based Navigation の位置分解能の向上
- 全方位カメラの色相情報を用いたLRFによるロボットの自己位置推定の拡張(2011 International Image Sensor Workshop(IISW)関連およびイメージセンサ一般)
- 色相ヒストグラムに基づく不変特徴を用いた画像中のオブジェクト検出(一般セッション,コンピュータビジョンとパターン認識のための機械学習)
- 色相ヒストグラムに基づく不変特徴を用いた画像中のオブジェクト検出(一般セッション,コンピュータビジョンとパターン認識のための機械学習)
- 顔画像を用いた個人識別による話者適応型音声認識手法(話者・分析・合成,認識,理解,対話,一般)
- 画像を手がかりとした時間的に適応可能な雑音推定による音声認識精度の向上に関する研究(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)