横顔の発話シーンを用いた口形コード法に基づく単語読唇(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では、読唇手法のひとつである口形コード法を発話者の横顔の発話シーンから得られた形状特徴量時系列に適用し、従来の母音キーフレームに追加して子音キーフレームの自動検出法を提案する.上下唇の距離と下唇突起長の差分値である横顔形状特徴量の時間的変化より子音キーフレームを検出することで、従来の母音のみによる口形コード時系列推移表現を拡張する.キーフレームの口形認識は、上唇高さ,下唇高さ,上唇突起長,下唇突起長,口唇角度の5特徴量を用いて行う.これより得られる単語コード列と候補単語のコード列に対して、DPマッチングを行い、最近傍となる候補単語を発話単語として推定する.常用27単語と類似単語10ペアの認識対象単語群を用いて2つの認識実験を行った結果、それぞれ90.4%,86.7%の高い認識率を得た.
- 2012-03-01
著者
-
浜田 望
慶応義塾大学 理工学部
-
浜田 望
慶應義塾大・理工学部
-
浜田 望
慶応義塾大学理工学システムデザイン工学科
-
浜田 望
慶應義塾大学理工学研究科総合デザイン工学専攻信号処理研究室
-
浜田 望
慶應義塾大学理工学研究科総合デザイン工学専攻
-
佐藤 優輝
慶應義塾大学理工学研究科総合デザイン工学専攻
-
浜田 望
慶應義塾理工学部システムデザイン工学科
-
沖田 慎介
慶應義塾大学理工学部システムデザイン工学科
-
菅田 雄希
慶應義塾大学院理工学研究科総合デザイン工学専攻
-
田阪 琢朗
慶應義塾大学院理工学研究科総合デザイン工学専攻
関連論文
- 遺伝的アルゴリズムを用いたジャズにおけるアドリブソロの生成
- 対数配置マイクロフォンアレイを用いたウェーブレット領域での音声と楽音の分離
- 極座標系ウェーブレットを用いたテクスチャ解析
- 極座標形 AR モデルを用いた2次元線スペクトル推定
- リフティングスキームを用いた領域別分解能をもつ画像圧縮
- パルス内位相変調合成帯域レーダにおけるドップラ補正に関する研究(レーダ信号処理及び一般)
- 対称アフィンシステムの設定点サーボ問題 : PI制御による実用安定化
- アフィン非線形システムのP・SPR・D制御とその倒立振子への応用 : 受動性に基づく安定化理論
- 多入力多出力システムの-制御方式(P+quasi-I+D制御) : 高ゲイン出力フィードバックに基づく安定化
- 音声と口唇縦線画像を融合した発話区間検出法(HCGシンポジウム)
- 動きブレを伴った移動物体画像に対するブランド超解像法(画像,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 多変数線形システムのPID制御による安定化 : 相対次数が2以下の場合
- 対称アフィンシステムの直接勾配降下制御による安定化制御
- PID制御による多変数系の固有値配置法
- Flock大域的最適化手法(研究速報)
- スケール変換と回転等への耐性をもつ電子透かし手法(情報セキュリティ応用)
- 中心多様体とニューラルネットに基づくクリティカルケースの非線形レギュレータ(システムと制御)
- PID制御による漸近安定化制御 : 最小位相性と高ゲインフィードバックに基づく安定性解析
- 複数の遅延情報を利用した時間-周波数マスキングによるブラインド音源分離
- PCAとICAを用いた正三角形アレーによる音源分離
- 多変数系の拡張PID制御--最小位相性と高ゲインフィードバックに基づく安定化
- 高ゲイン出力フィードバック定理の一般化と証明
- 信号共分散行列の固有ベクトルを利用した仮想入射波付加法(研究速報)
- 固有ベクトルを利用した仮想入射波付加法
- 最小2乗法に基づく2次元適応格子形フィルタ
- 3次元IIR適応格子形フィルタについて
- 2次元非対称半平面格子形フィルタの設計とその安定条件について
- 非対称半平面マスクを持つ2次元格子形フィルタとその安定性について
- 3次元格子形フィルタとスペクトル解析への応用
- A-137 拡張した2次元格子形フィルタによるARモデリング(A-4. ディジタル信号処理,一般講演)
- 1次元および2次元離散時間システムの群遅延特性近似法
- 動きブレを伴った移動物体画像に対するブランド超解像法(画像,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 動きブレを伴った移動物体画像に対するブランド超解像法(画像,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 周波数-時間混成領域における移動物体の速度推定
- 周波数-時間混成領域における移動物体の速度推定
- A-4-18 時間-周波数混成領域 (MixeD) における直線軌道信号の速度推定
- ホップフィールドネットワークを用いたアレーセンサ誤差にロバストな到来方向推定法
- ホップフィールドネットワークを用いた分散波源の到来方向推定(多次元信号処理とその応用・実現論文小特集)
- ホップフィールドネットワークを用いた分散波源の到来方向推定法
- マイクロフォンアレイを用いたウェーブレットパケットによる音声と楽音の分離
- 周波数領域適応処理を用いた一般化サイドローブキャンセラの設計
- 音声の調波構造を方向推定に適用したマイクロフォンアレイシステム
- 音声の調波構造を方向推定に適用したマイクロフォンアレイシステム
- 音声の調波構造を方向推定に適用したマイクロフォンアレイシステム
- ブロッキング操作にニューラルネットワークを用いたGSC
- 広帯域目標信号の到来方向追尾機能を有する一般化サイドローブキャンセラ
- 2次元ラテイスフィルタによる適応ビームフオーミング
- 擬似極配置によるPIDコントローラ調整法
- A-4-1 非線形エッジ要素を利用したテクスチャ領域の検出法
- 3次統計量より得られた位相情報に基づく非最小位相 ARMA システム同定法
- ニューラルネットによるHamilton-Jacobi方程式の解法と非線形システムの最適フィードバック制御則
- 分散映像符号化のための領域解析に基づく超解像度復元法 (通信方式)
- 超解像を利用したDVCにおける符号化効率の改善 (通信方式)
- 分散映像符号化のための領域解析に基づく超解像度復元法 (信号処理)
- 超解像を利用したDVCにおける符号化効率の改善 (信号処理)
- 分散映像符号化のための領域解析に基づく超解像度復元法 (回路とシステム)
- 超解像を利用したDVCにおける符号化効率の改善 (回路とシステム)
- 直交ミラーフィルタバンクの出力を利用したMUSIC法による高速移動目標の測角方式
- 対数配置マイクロフォンアレイを用いたウェーブレット領域での音声と楽音の分離
- 対数配置マイクロフォンアレイを用いたウェーブレット領域での音声と楽音の分離
- 零点周波数オフセットを用いたスタガトリガレーダ用縦続接続クラッタ抑圧フィルタ(計測・探査)
- A-20-9 モード間の相関性を用いたマルチモーダル単語音声認識(A-20.スマートインフォメディアシステム,一般セッション)
- B-2-13 パルス内符号変調を併用した合成帯域レーダの研究(B-2.宇宙・航行エレクトロニクス,一般セッション)
- 電場の結果を考慮した反応拡散系における空間パターン形成の数値解析
- 感染伝播を考慮したLotka-Volterraモデルの解の挙動について
- 感染伝播を考慮した Lotka-Volterra モデルの解の挙動について
- 信号処理 : アナログフィルタ
- ブロックマッチングにおけるブロック分割と統合を含む動き推定法(ネットワークプロセッサ,通信のための信号処理,及び一般)
- ブロックマッチングにおけるブロック分割と統合を含む動き推定法(ネットワークプロセッサ,通信のための信号処理,及び一般)
- ブロックマッチングにおけるブロック分割と統合を含む動き推定法(ネットワークプロセッサ,通信のための信号処理,及び一般)
- 動的制御による新しい大域的最適化アルゴリズム(数値計算,数理計画法)
- 適応的なブロック形状を用いた動きベクトル推定
- マーカーを用いた学習による特定話者の発話認識(システムオンシリコン,RFID技術,一般)
- 視覚的注意に適した詳細ポリゴンモデルのインタラクティブ表示手法
- 3次元格子形フィルタとスペクトル解析への応用
- ハミルトニアンシステムの最適フィードバック制御
- 固有ベクトルを利用した仮想入射波付加法
- 固有ベクトルを利用した仮想入射波付加法
- マーカーを用いた学習による特定話者の発話認識
- 分散映像符号化のための領域解析に基づく超解像度復元法(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 分散映像符号化のための領域解析に基づく超解像度復元法(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 分散映像符号化のための領域解析に基づく超解像度復元法(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 和文古文書画像からの高速単語検索アルゴリズム(テーマセッション,文字・文書の認識と理解)
- 超解像を利用したDVCにおける符号化効率の改善(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 超解像を利用したDVCにおける符号化効率の改善(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 超解像を利用したDVCにおける符号化効率の改善(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 任意マイクロホンアレーにおけるパーティクルフィルタを用いた複数移動音源の追跡 (通信方式)
- 口笛音声の検出およびパターンの認識とARインタフェースへの応用 (第28回センシングフォーラム資料 : センシング技術の新たな展開と融合) -- (生体計測3)
- A-4-8 適応的な形状を用いたブロック勾配法による動きベクトル推定
- 学習型カーネル回帰による超解像を用いた分散映像符号化法(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 横顔の発話シーンを用いた口形コード法に基づく単語読唇(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 横顔の発話シーンを用いた口形コード法に基づく単語読唇(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 横顔の発話シーンを用いた口形コード法に基づく単語読唇(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 単一試行脳波を用いたP300スペラーにおける適切な電極選択(ソフトコンピューティング,一般)
- 任意マイクロホンアレーにおけるパーティクルフィルタを用いた複数移動音源の追跡(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 任意マイクロホンアレーにおけるパーティクルフィルタを用いた複数移動音源の追跡(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 学習型カーネル回帰による超解像を用いた分散映像符号化法(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 学習型カーネル回帰による超解像を用いた分散映像符号化法(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 経験的モード分解を用いた顔画像からの皺検出(ソフトコンピューティング,一般)
- 経験的モード分解を用いた特徴抽出による画像の属性推定(ソフトコンピューティング,一般)