騒音環境下での音声理解のための唇認識と音声認識
スポンサーリンク
概要
- 論文の詳細を見る
情報の入力手段の一つとして音声が有望視され、音声認識技術も比軟的静かな環境では実用に耐えうる認識率が得られるようになってきている。しかし、実際の応用を考えた場合、その利用環境では様々なノイズが無視できない場合が多い。そこで我々は、画像認識を使った唇情報を併用することによって、音声認識の認識性能を向上させる方式について研究を進めている。我々の提案する唇情報と音声認識の融合方式は、音声認識から出力される複数の候補から、唇情報を用いて取捨選択するという方式である。本発表では、方式の概略と性能評価結果について報告する。
- 一般社団法人情報処理学会の論文
- 1996-07-26
著者
-
藤井 明宏
沖電気工業株式会社関西総合研究所
-
宮崎 敏彦
沖電気工業株式会社関西総合研究所
-
宮崎 敏彦
沖電気工業
-
奥村 晃弘
沖電気工業株式会社研究開発本部関西総合研究所
-
岡野 健治
沖電気工業株式会社研究開発本部関西総合研究所
-
藤井 明宏
沖電気工業(株)研究開発本部関西総合研究所
-
藤井 明宏
沖電気工業 関西総研
-
奥村 晃弘
沖電気工業(株)関西総合研究所
関連論文
- インターネット上での多地点間音声通信システムの検討
- 1)ヒューマンインタフェースを向上させたTV会議支援環境(画像通信システム研究会)
- ヒューマンインタフェースを向上させたTV会議支援環境 : 画像通信システム
- ヒューマンインタフェースを向上させたTV会議支援環境
- 画像濃度の統計的性質を利用した高速真偽判別方式
- 画像濃度の統計的性質を利用したパタン真偽判別方法
- 金融自動取引機の在高予測
- 英会話用知的CAIシステムの教材作成支援における文生成の利用
- 英会話用知的CAIのための教材記述形式
- 虹彩自動撮影型個人認証システムの開発
- 単眼動画像からパノラマステレオ画像の生成
- 解説 顔画像情報による音声認識性能の改善--音声認識の周囲雑音による認識率低下の抑制
- 顔画像情報と音声情報の統合による発話認識
- 唇の動き情報による騒音環境下での音声認識性能の改善
- 騒音環境下での発話理解のための音響処理と画像認識
- 唇の動き情報を利用した単語認識
- 唇の動き情報を利用した単語認識
- 騒音環境下での音声理解のための唇認識と音声認識
- 動き情報を用いた唇の抽出法
- ドローイングが可能なアプリケーション共有システムの開発
- 入力のマルチモーダル化ツール : 影武者
- イベントマクロによるWindow Systemの高度化とその応用
- マルチモーダルインタラクションシステムの試作
- 音声対話を実現した英会話用知的 CAI システムの構成
- 画像処理技術による障害物検出と移動物体追跡方法()
- 可視・赤外センサフュージョンによる車両検知システム
- 可視・赤外線センサの映像融合による道路監視システム
- 構造化メッセージに基づくグループワークの記述方法
- 電子メールの自動処理によるグループワーク支援