顔画像情報と音声情報の統合による発話認識
スポンサーリンク
概要
- 論文の詳細を見る
我々は, 騒音環境でもロバストな発話理解の研究として, 音声認識と唇の動き情報の統合方式の研究を進めている.本論文では, 顔および唇の位置検出方式, および, 抽出した唇の動き情報を使った音声認識との統合方式を提案する.そして擬似的に雑音を加えた発話認識実験において, 唇情報を併用することにより, 雑音が6dBのときの認識率を5.24%から91.5%に改善することができ, 本統合方式が有効に機能することを確認した.
- 一般社団法人情報処理学会の論文
- 1998-12-15
著者
-
濱口 佳孝
沖電気工業株式会社研究開発センタ
-
宮崎 敏彦
沖電気工業株式会社関西総合研究所
-
宮崎 敏彦
沖電気工業
-
濱口 佳孝
沖電気工業
-
奥村 晃弘
沖電気工業株式会社研究開発本部関西総合研究所
-
岡野 健治
沖電気工業株式会社研究開発本部関西総合研究所
-
奥村 晃弘
沖電気工業(株)関西総合研究所
関連論文
- 効率的な頻出データ計数アルゴリズムLossy Countingの拡張(トラヒック)
- 有線および無線リンク混在ネットワークにおけるRTCP XR観測に基づくネットワーク品質劣化検出 (情報ネットワーク)
- NGNにおけるネットワーク異常検出のためのRTPトラフィック予測手法(トラヒック,セッション管理,P2P通信,オーバーレイネットワーク,性能解析・評価,信頼性及び一般)
- 大規模トラフィックの解析技術 (ネットワーク特集)
- インターネット上での多地点間音声通信システムの検討
- 有線および無線リンク混在ネットワークにおけるRTCP XR観測に基づくネットワーク品質劣化検出(トラヒック計測・異常検知・一般)
- Web文書集合からの専門用語獲得(自然言語,情報処理技術のフロンティア)
- 属性影響語を用いた専門用語判別(専門用語)
- 属性影響語を用いた専門用語判別(専門用語)
- 統計的に獲得された用語への属性ラベル付与(Web情報処理)
- 検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
- 統計的に獲得された用語への属性ラベル付与(Web情報処理)
- 検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
- 画像濃度の統計的性質を利用した高速真偽判別方式
- 画像濃度の統計的性質を利用したパタン真偽判別方法
- 金融自動取引機の在高予測
- 英会話用知的CAIシステムの教材作成支援における文生成の利用
- 英会話用知的CAIのための教材記述形式
- Webからの情報抽出・検索システムにおける全文検索(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- Webからの情報抽出・検索システムにおける全文検索(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- D-002 値の範囲を検出可能な数値情報抽出(D分野:データベース)
- 単眼動画像からパノラマステレオ画像の生成
- 解説 顔画像情報による音声認識性能の改善--音声認識の周囲雑音による認識率低下の抑制
- 顔画像情報と音声情報の統合による発話認識
- 唇の動き情報による騒音環境下での音声認識性能の改善
- 騒音環境下での発話理解のための音響処理と画像認識
- 唇の動き情報を利用した単語認識
- 唇の動き情報を利用した単語認識
- 騒音環境下での音声理解のための唇認識と音声認識
- 動き情報を用いた唇の抽出法
- ドローイングが可能なアプリケーション共有システムの開発
- 入力のマルチモーダル化ツール : 影武者
- イベントマクロによるWindow Systemの高度化とその応用
- マルチモーダルインタラクションシステムの試作
- 音声対話を実現した英会話用知的 CAI システムの構成
- 可視・赤外センサフュージョンによる車両検知システム
- 可視・赤外線センサの映像融合による道路監視システム
- メール要点抽出&転送システム/早解メール (マルチメディアメッセージング特集)
- 有線および無線リンク混在ネットワークにおけるRTCP XR観測に基づくネットワーク品質劣化検出
- 構造化メッセージに基づくグループワークの記述方法
- 電子メールの自動処理によるグループワーク支援